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根据 原 国家 教育 委员 会 (普通 高 等 教育 “ 九 五 ”国家 级 重点 教材 立项 ,管理 
办 法 》 的 要 求 ,国家 统计 局 经 过 专家 评审 ,五 种 教材 被 立项 ,其 中 :三 种 教材 是 
在 “< 八 五 ”期 间 规 划 统 计 教 材 的 基础 上 进行 修订 的 ,二 种 教材 属 “ 九 五 ”期 间 新 
编 规 划 统 计 教 材 ,这 五 本 教材 的 编审 工作 由 全 国 统计 教材 编审 委员 会 负责 审定 。 

“ 抓 重点 ,出 精品 > 是 “ 九 五 > 期间 普 通 高 等 教育 教材 建设 与 改革 工作 的 核 
心 .按照 教育 部 的 要 求 , 国 家 级 重点 教材 都 应 建设 成 “ 九 五 ”普通 高 等 教育 的 精 
员 教 材 。 根 据 这 一 精神 ,这 批 教 材 力求 适应 我 国政 治 、 经 济 、 科 技 、 教 育 等 改革 
的 形势 ,充分 反映 改革 的 成 果 , 同 时 适应 专业 目录 调整 及 专业 面 拓 宽 以 后 教学 
改革 的 实际 需要 ,科学 、 合 理 地 设置 教材 体系 和 安排 教材 内 容 , 努 力 提 高 教材 
质量 。 

相信 通过 这 批 教 材 的 出 版 .发行 ,对 我 国 普 通 高 等 教育 统计 教材 建设 工作 
将 起 到 较 好 的 示范 、 导 向 作用 ;对 提高 统计 教育 水 平和 培养 面向 21 世纪 的 统 
计 人 才 也 将 发 挥 积极 的 促进 作用 。 

限于 水 平和 经 验 , 这 批 教材 的 编审 .出 版 工作 还 会 有 缺点 和 不 足 之 处 , 诚 
娠 欢迎 教材 的 使 用 单位 .广大 教师 和 同学 们 提出 批评 和 建议 。 


全 国 统计 教材 编审 委员 会 
1999 年 3 月 
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本 书 是 按照 全 国 统计 教材 编审 委员 会 制定 的 《概率 论 与 数理 统计 教学 大 
纲 》 编 写 的 ,是 供 全 国 高 等 学 校 统计 专业 本 科 生 学 习 用 的 教科 书 。 全 书 十 章 分 
二 部 分 ,前 四 章 是 概率 论 部 分 ,主要 讲述 概率 论 的 基本 概念 和 基本 结论 ,其 中 
心 内 容 是 随机 变量 及 其 分 布 ,后 六 章 是 数理 统计 部 分 ,主要 讲述 数理 统计 基本 
概念 和 常用 统计 方法 ,其 中 心 内 容 是 统计 推断 的 三 个 内 容 :抽样 分 布 .参数 估 
计 和 假设 检验 。 

学 习 这 门 课 的 读者 主要 是 着 眼 于 社会 .经 济 管理 领域 中 的 应 用 ,因此 我 们 
尽量 用 社会 经济、 管理 方面 的 例子 讲述 各 种 基本 概念 .基本 理论 和 基本 方法 ， 
努力 说 明 其 丰富 的 实际 背景 ,特有 的 思维 方式 .广泛 的 应 用 范围 。 虽 然 全 书 有 
200 个 例子 ,为 数 不 少 ,但 毕竟 有 限 ,为 了 今后 能 很 好 应 用 统计 方法 ,现在 要 把 
学 习 重 点 放 在 对 概念 .定理 和 方法 的 直观 理解 和 数学 表达 上 ,只 有 理解 了 的 东 
西 才 能 更 深刻 地 感觉 它 , 从 而 才能 正确 地 使 用 它 ,准确 的 数学 表达 是 检验 你 是 
否 理解 了 ,基于 这 个 考虑 ,我 们 在 氢 述 上 尽量 启发 你 的 思维 ,推理 和 演算 上 坚 
持 严 谨 , 能 证 则 证 ,这 一 种 严格 训练 对 进一步 学 习 后 继 的 统计 课程 和 今后 的 应 
用 是 十 分 必须 的 。 书 中 部 分 节 与 段 打 x 号 ,在 教学 中 可 以 删 去 ,因为 这 都 是 扩 
大 和 加 深 知 识 面 的 内 容 。 

本 书 各 章 后 都 附 有 大 量 习 题 ,其 中 大 部 分 是 练习 性 的 ,以 巩固 本 书 内 容 为 
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主要 目的 ,真正 有 难度 的 题目 只 占 少 部 分 ,独立 地 完成 这 些 题目 对 掌握 这 门 课 
程 是 必 不 可 少 的 。 如 果 在 做 习题 上 不 肯 花 功夫 ,有 鞭 难 情绪 , 那 今后 在 应 用 中 
遇 到 困难 时 , 皇 能 有 攻关 的 勇气 和 能 力 蛇 ? 

本 书 的 编写 目 始 至 终 得 到 国家 统计 局 统计 干部 培训 中 心 的 关心 和 帮助 ， 
中 国人 民 大 学 倪 加 勋 教授 耐心 细致 地 审阅 全 书 也 使 本 书 增色 不 少 ,中 国 统计 
出 版 社 副 总 编 谢 鸿 光 先 生 为 编辑 出 版 此 书 花 了 很 多 心血 , 尤 进 红 亦 为 本 书 提 
供 大 量 习 题 ,在 此 一 并 表示 衷心 的 感谢 。 

H TREK PARR , 错 雇 之 处 在 所 难免 ,有 恳请 国内 同行 和 广大 读者 批评 指 
正 。 
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本 书 是 按 经 济 类 统计 专业 本 科 生 教科 书 的 要 求 编写 的 ,出 版 后 反映 尚 可 ， 
肯定 了 我 们 在 与 经 济 .管理 相 结 合 上 所 做 的 努力 ,意见 主要 集中 在 内 容 深 浅 和 
多 少 上 ,说 深 的 也 有 ,说 浅 的 也 有 ,但 都 认为 内 容 过 多 。 内 容 深浅 确 难于 掌握 ， 
为 适应 将 来 的 应 用 和 研究 生 入 学 考试 的 需要 ,内 容 不 宜 过 浅 ,为 使 多 数学 生 能 
过 到 基本 要 求 ,通过 合格 考试 ,内 容 又 不 宜 过 深 。 根 据 教 师 和 学 生 的 这 些 意见 ， 
我 们 对 全 书 作 了 较 大 的 变动 。 

首先 是 减少 内 容 , 突 出 基础 部 分 ,把 原来 的 十 章 压缩 为 七 章 。 把 极限 定理 
一 章 压 缩 为 一 节 ( 8 3.5), 把 方差 分 析 和 回归 分 析 压 缩 成 为 一 章 , 把 贝 叶 斯 统 
TIERNOS 5. 7), 然 后 在 每 章 中 或 多 或 少 地 删 去 一 些 内 容 ,或 把 一 
些 内 容 转 入 习题 。 估 计 讲 完全 书 可 能 需要 7280 节 课 。 为 了 适应 不 同 的 课时 
计划 ,我 们 又 在 一 些 章节 打上 “* ”号 ,以 示 可 以 不 讲 或 少 讲 。 假 如 把 这 些 打 上 
“*” 写 的 草 节 都 不 讲授 的 话 ,那么 本 书 还 可 以 作为 经 济 类 和 管理 类 各 专业 使 
用 的 《概率 论 与 数理 统计 》 课 程 的 教材 。 

其 次 ,我 们 力图 通过 例子 和 习题 把 概率 论 与 数理 统计 的 基本 内 容 渗透 到 
经 济 和 管理 各 专业 中 去 ,为 此 我 们 把 自己 经 受过 的 实例 和 看 到 的 国内 外 例子 
经 过 改写 大 量 地 引入 本 书 , 目 的 是 使 学 生 认识 到 手中 有 无 概率 统计 工具 对 自 
己 今 后 学 习 、 工 作 和 发 展 将 会 有 重要 影响 ， 掌握 了 这 个 工具 至 少 对 先进 的 成 果 
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你 能 听 懂 或 看 懂 ,不 至 于 “ 坐 飞机 ”。 

最 后 一 个 大 的 变动 就 是 把 习题 分 节 设 置 , 另 立成 册 , 并 附 答案 ,部 分 题目 
给 提示 或 详细 解答 ,这样 习 题 的 针对 性 强 了 ,习题 数量 也 明显 增多 ,几乎 增加 
了 40% 左 右 ,但 增加 的 习题 大 多 为 基本 题 ,大 多 能 为 学 生 做 出 ,以 期 引起 学 生 
动手 的 兴趣 ,提高 学 生 学 好 这 一 门 课 的 信心 。 

原 书 中 的 一 些 特色 仍 被 保留 ,用 学 生 熟 知 的 一 些 事实 来 引进 每 个 基本 概 
念 ,启发 和 培养 概率 统计 的 思维 方式 ,在 推理 和 演算 上 仍 坚 持 严谨 ,能 证 则 证 。 
此 外 ,对 零 概率 事件 (几乎 处 处 )、 渐 近 分 布 . 描 述 性 统计 ,检验 的 p 值 等 基本 概 
念 也 加 重 了 笔墨 ,力图 把 基本 思想 讲 清 楚 ,今后 敢于 去 使 用 它们 ， 

以 上 这 些 想 法 ,我 们 努力 去 做 ,做 得 如 何 还 要 广大 教师 和 同学 评议 ,欢迎 
批评 ,我们 将 进一步 改进 。 趁 此 机 会 ,我 们 对 批评 过 第 一 版 书 的 教师 和 同学 表 
示 深 深 的 感谢 ,没有 他 们 的 意见 ,我 们 不 会 下 决心 改 成 这 个 样子 。 同 时 还 要 感 
谢 仔细 审阅 新 版 手稿 的 北京 大 学 陈 家 鼎 教授 ,耿直 教授 和 中 国人 民 大 学 倪 加 
勋 教授 ,由 于 采纳 了 他 们 的 改进 意见 ,使 本 书 质量 提高 了 一 步 。 最 后 对 国家 统 
计 局 教育 中 心 教 材 处 和 统计 出 版 社 表示 感谢 ,没有 他 们 的 热心 指导 和 出 色 的 
组 织 工作 不 可 能 使 本 书 新 版 迅速 问世 。 
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随机 事件 及 其 概 泰 


$1.1 随机 事件 及 其 运算 


¡EA 


1. 随机 现象 :在 一 定 条 件 下 ,并 不 总 是 出 现 相 同 结果 的 现象 。 
随机 试验 :可 重复 的 随机 现象 。 
基本 结果 w: 随 机 现象 的 最 简单 的 结果 , 它 将 是 统计 中 抽样 的 基本 单 
元 , 故 又 称 样 本 点 。 
基本 空间 4: 随机 现象 所 有 基本 结果 的 全 体 。 
2. 事件 与 集合 的 对 应 关系 。 


(2) 一 位 顾客 在 超市 购买 的 商品 件数 ; 

(3) 一 位 顾客 在 超市 排队 等 候 付 款 的 时 间 ， 

(4) 一 颗 麦 穗 上 长 着 麦 粒 个 数 ，; 

(5) 一 台电 视 机 的 寿命 (从 开始 使 用 到 第 一 次 维修 的 时 间 ); 

(6) 某 城市 一 天 内 发 生 交 通 事 故 的 次 数 ， 

(7) 测 量 某 物 理 量 (长 度 . 直 径 等 ) 的 误差 ， 

读者 还 可 列举 很 多 有 趣 的 随机 现象 。 

很 多 随机 现象 是 可 以 大 量 重复 的 ,如 抛 一 枚 硬币 可 以 无 限 次 重复 ,不 同 麦 
穗 上 的 麦 粒 数 可 以 大 量 观 察 等 ,这 种 可 重复 的 随机 现象 又 称 为 随机 试验 ,简称 
试验 .以 后 常 把 检验 一 件 产品 看 作 做 一 次 试验 ,观察 一 颗 麦 穗 上 的 麦 粒 数 也 看 
作 一 次 试验 。 也 有 很 多 随机 现象 是 不 能 重复 的 ,明年 世界 经 济 是 增长 还 是 豪 
退 ,一 场 足 球赛 的 输赢 都 是 不 能 重复 的 随机 现象 .本 书 主 要 研究 能 大 量 重复 的 
随机 现象 ,但 也 十 分 注意 研究 不 能 重复 的 随机 现象 ,因为 后 者 在 我 们 经 济 生活 
中 占有 重要 地 位 。 


111.2 基本 空间 (样本 空间 ) 

认识 一 个 随机 现象 首要 的 是 能 罗列 出 它 的 一 切 可 能 发 生 的 基本 结果 ,这 
里 “基本 结果 ”是 指 随机 现象 的 最 简单 的 结果 ,如 抛 一 榴 硬币 就 有 两 个 基本 结 
E; 

正面 ， 反面 
BET AA TEA AR: 
1 点 ,2 点 ,3 点 ,4 点 ,5 点 ，6 点 

随机 现象 所 有 基本 结果 的 全 体 称 为 这 个 随机 现象 的 基本 空间 。 常 用 0= 
lw} 表示 ,其 中 元 素 w 就 是 基本 结果 。 在 统计 学 中 ,基本 结果 o 将 是 抽样 的 基 
本 单元 , 故 基本 结果 又 称 为 样本 点 ,基本 空间 又 称 为 样本 空间 ,如 抛 一 枚 硬币 
的 基本 空间 为 | 

0,=(0,w0,)= (1E H , 115) 
其 中 ,wo 表示 正面 ,w KRKE, A MR EPA FEA 
2 = (0, ,07,03,004,05+0)=1[1,2,3,4,5,6) 

基本 空间 可 以 由 有 限 个 (至 少 二 个 ) 基 本 结果 组 成 (如 Q, 和 0 那样 ), 也 
可 由 无 限 个 基本 结果 组 成 ,对 有 限 的 基本 空间 要 注意 其 中 基本 结果 的 个 数 , 对 
无 限 的 基本 空间 要 注意 区 分 其 中 基本 结果 是 可 列 个 ,还 是 不 可 列 个 ， 

例 1.1.2 例 1.1.1 中 7 个 随机 现象 的 基本 空间 有 如 下 三 种 ， 


(1) 一 天 内 进入 某 超市 的 顾客 数 ” 的 基本 空间 Q3 可 用 非 负 整数 集 表 示 , 且 
0 一 {0,1,2,… ,500,…，105，…} 

这 是 一 个 含有 可 列 个 基本 结果 的 基本 空间 ,其 中 0? 表示 “无 人 光顾 超市 ?。 这 
在 流行 性 感冒 右 行 的 日 子 里 , “超市 无 人 光顾 ”不 是 没有 可 能 发 生 的 ,为 了 不 遗 
泌 任 一 种 可 能 结果 ,应 把 “0” 作 为 基本 结果 放 入 基本 空间 ,另外 ,该 基本 空间 还 
含有 “十 万 ”,“ 百 万 ”等 基本 结果 ,当然 ,“ 一 天 内 有 十 万 人 进入 该 超市 ”是 不 可 
想象 的 ,但 我 们 仍 把 它 放 入 基本 空间 Q:, 原 因 有 二 :一 是 我 们 不 能 确切 地 说 出 
一 天 进入 超市 的 最 多 人 数 ,看 随便 说 一 个 很 大 的 数 , 那 它 与 十 万 也 无 本 质 差 
别 , 因 为 对 超市 来 说 ,都 可 当 作 无 穷 多 人 数 了 ;二 是 数学 抽象 的 需要 ,这 会 使 数 
党 处 理 方便 ,而 又 不 失真 。 

类 似 地 可 以 看 出 , 例 1.1.1 中 的 第 2. 第 4、 第 6 个 随机 现象 都 可 用 基本 空 
间 O, 来 描述 。 

(2)“ 一 台电 视 机 的 寿命 ”的 基本 空间 可 用 非 负 实数 集 表示 , 即 

Q=ixic=0) 

其 中 “0” 表 示 电 视 机 在 开始 使 用 时 就 发 生 故 障 需 要 维修 ,“10000” 表 示 电 视 机 
工作 10000 小 时 时 发 生 故 障 需 要 维修 ,类 似 地 可 以 看 出 ,“ 一 位 顾客 在 超市 排 
队 等 候 付款 的 时 间 ” 的 基本 空间 也 可 用 f2, 描述 ,这 两 个 随机 现象 的 基本 空间 
相同 ,但 它们 最 可 能 发 生 的 时 间 段 有 很 大 差别 ,电视 机 寿命 常 在 1 万 到 10 万 
小 时 内 ,而 排队 等 候 付 款 时 间 常 在 10 分 钟 以 内 。 

(3)“ 测 量 某 物理 量 的 误差 ”的 基本 空间 常用 整个 实数 集 表示 , 即 

0 一 {z: 一 co<z<co) 

因为 测量 误差 可 正 可 负 . 可 大 可 小 ,具体 是 多 少 , 人 们 事先 无 法 知道 ,以 后 会 看 
到 ,用 Os 作 测 量 误 差 的 基本 空间 会 给 数学 处 理 带 来 很 多 方便 ,但 又 不 会 失真 。 


1.1.3 随机 事件 

随机 现象 的 某 些 基本 结果 组 成 的 集合 称 为 随机 事件 ,简称 事件 ,常用 大 写 
字母 4.B.C 等 表示 ,如 在 搓 一 颗 咒 子 , “出 现 奇数 点 ”是 一 个 事件 , 它 是 由 1 
氮 、3 点 .5 点 等 三 个 基本 结果 组 成 , 若 记 这 个 事件 为 4, 则 有 4={1,3,5)。 

从 这 个 定义 可 见 ,事件 有 如 下 几 个 特征 ， 

(1) 任 一 事件 4 是 相应 基本 空间 Q 中 的 一 个 子 集 ,在 概率 论 中 常用 一 个 
长 方形 示意 基本 空间 Q, 用 其 中 一 个 园 ( 或 其 它 几 何 图 形 ) 示 意 事 件 4, 见 
图 1. 1.1 ,这 类 图 形 称 为 维 恩 (Venn) 图 。 

(2) 事 件 4 发 生 当 且 仅 当 4 中 某 一 基本 结果 发 生 ,或 者 说 , 当 wm(E 4) 发 
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图 1.1.1 事件 4 的 维 思 图 
生 , 则 说 事件 4 发 生 ; 当 ws(EA4) 发 生 , 则 说 事件 4 不 ( 没 ) 发 生 。 
(3) 事 件 4 的 表示 可 用 集合 ,也 可 用 语言 ,但 所 用 语言 要 使 大 家 明白 无 误 。 
例 1.1.3 抛 两 枚 硬币 的 基本 空间 9 由 下 列 四 个 基本 结果 组 成 : 
di 一 (下 , 正 ) w = Es) 
w= (L, IE) w= (RAR) 
下 面 几 个 事件 可 用 集合 形式 表示 ,也 可 用 语言 形式 表示 。 
A 二 “至 少 出 现 一 个 正面 ”= (0, ,ass 
B= 二 “最 多 出 现 一 个 正面 ”= (0, 0; , 04) 
C 一 “恰好 出 现 一 个 正面 ?一 {wz , 00) ) 
D==“ 出 现 二 面相 间 ”= {w ,ww} 

例 1.1.4 掷 一 颗 般 子 “出 现 6 点 ”“ 出 现 偶 数 点 ”“ 出 现 点 数 不 超 过 
2”“ 出 现 点 数 不 等 于 3? 都 是 事件 ,在 依次 记 为 4.B、C、D, 那 它们 都 可 以 用 其 
基本 空间 Q=={1,2,3,4,5,6) 的 某 个 子 集 表示 。 

l A=(6) B=(2,4,6) 
C= {1,2} D={1,2,4,5,6} 

可 以 设想 你 处 在 这 样 一 种 情况 ,在 掷 仍 子 前 约定 ,出 现 偶 数 点 (事件 B) 就 
PR .者 掷 的 结果 出 现 4 A KAFET HFB RET) ERE? 点 或 6 点 ， 
你 也 中 奖 了 ,这 说 明 , 事 件 B 虽 由 三 个 基本 结果 组 成 ,但 只 要 其 中 任 一 个 出 现 
就 说 事件 BRET. | 

EUR MET AAA RRA ABOG NARRO) ERA x 表示 第 
— YET IN ADO y 表示 第 二 颗 般 子 出 现 的 点 数 , 这 一 随机 现象 的 基本 空 
间 为 

人 1 一 (人 (zyy) +. 2,y=1,2,3,4,5,6) 
ERA 36 个 基本 结果 。 下 列 事件 都 可 看 作 Qi 的 某 个 子 集 。 
41 二 “点数 之 和 等 于 2” 二 {(1,1)})。 
Bi 一 “点数 之 和 等 于 5”=={(1,4),(2,3),(3,2),(4,1)})。 
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C1 一 “点 数 之 和 超过 9 =((4,6),05,5),(6,4),(5,6),(6,5),(6,6)). 

Di 二 “点 数 之 和 不 小 于 4, 也 不 超过 6” 二 人 {(1,3),(2,3),(3,1),(],4)， 
(2,3),C3,2),C4,1),(1,5),(2,4),(3,3)(4,2)(5,1)}, 

上 述 事件 A,B Co D 都 是 基本 空间 的 子 集 。 它们 可 用 图 1.1.2 直观 地 
表示 出 来 。 


1] 2 3 4 5 86 x 
图 1.1.2 基本 空间 0, 与 某 些 事件 的 示意 图 


1.1.4 必然 事件 与 不 可 能 事件 

任 一 个 基本 空间 0 都 有 一 个 最 大 子 集 (基本 空间 本 身 Q) 和 一 个 最 小 子 
BEBO ,最 大 子 集 称 为 必然 事件 , 仍 用 Q 表示 ,最 小 子 集 称 为 不 可 能 事件 ， 
用 空 集 符号 % 表 示 。 

如 掷 一 颗 骨 子 ,出现 点 数 不 超 过 6? 就 是 一 个 必然 事件 ,因为 它 含有 基本 
空间 Q= {1,2,3,4,5,6) 中 一 切 可 能 的 基本 结果 ,任何 一 个 基本 结果 w 出 现 必 
导致 Q 发生, 由 此 可 见 必然 事件 是 肯定 要 发 生 的 事件 。 又 如 所 一 颗 山 子 ,“ 出 
现 7 点 ”就 是 一 个 不 可 能 事件 ,因为 它 不 含有 基本 空间 Q 中 任 一 个 基本 结果 ， 
即 它 是 O 的 空 集 ,由 此 可 见 , 不 可 能 事件 $ 是 肯定 不 会 发 生 的 事件 。 


111.5 事件 间 的 关系 
为 以 后 的 概率 计算 化 繁 就 简 , 需要 研究 事件 间 的 关系 与 事件 的 运算 规则 ， 
这 里 先 人 研究 事件 间 关 系 , 事 件 间 关 系 与 集合 间 关 系 一 样 主要 有 以 下 三 种 ， 
(1) 事 件 的 包含 。 设 在 同一 个 试验 里 有 两 个 事件 4 与 B, 若 事件 A 中 任 一 
基本 结果 必 在 B 中 , 则 称 4 被 包含 在 B 中 ,或 8 包含 4, 记 为 4CB BD 
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4, 这 时 事件 4 的 发 生 必 导 致 事件 B 的 发 生 , 如 图 1.1.3 PR 00 — MR 
子 , 事 件 A 二 “出 现 4 点 ”的 发 生 必 导致 事件 8B 二 “出现 偶 数 点 ”的 发 生 , 故 AC 
B. 

显然 ,对 任 一 个 事件 A DA MADE. 


图 1.1.3 BDA 


《2) 事 件 的 相等 . 设 在 同一 试验 里 有 两 个 事件 4 与 B, 若 4 中 任 一 基本 结 
未 必 在 B PCCB), m B 中 任 一 基本 结果 也 必 在 A 中 (8CA), 则 称 事 件 4 
5 B$, WA A=B, X} A 与 互 必 含有 相同 的 基本 结果 . OMA 
基本 结果 记 为 (zx,y), 其 中 zz 与 y 分 别 为 第 一 和 第 二 颗 钥 子 出 现 的 点 数 ,定义 
如 下 两 个 事件 ， 


一 “Xx 十 y= 二 奇数 ” 
B=*x5 y 的 奇偶 性 不 同 ” 
现 来 证 明 这 二 个 事件 相等 。 若 (z,y)E4, 即 z 十 y 一 奇数 , 则 z 与 y 中 必 是 一 
个 奇数 , 另 一 个 是 偶数 ,这 表明 z 与 y 的 奇偶 性 不 同 , 即 (zx;y)EB, 亦 即 AC 
B。 肥 之 ,大 (z,y)€EB, 即 xz 与 yy 的 奇偶 性 不 同 , 则 其 和 必 为 奇数 ,这 又 有 (zx， 
y)E4, 即 BC4, 这 样 我 们 就 证 明了 A=B, 

(3) 事 件 的 互 不 相 容 性 .在 同一 个 试验 里 , 若 两 个 事件 4 与 妃 没 有 相同 的 
基本 结果 , 则 称 事件 4 与 B 互 不 相 容 ,或 称 互 斥 .这 时 事件 4 与 B 不 可 能 同时 
发 生 , 见 图 1. 1.4(a)。 如 在 电视 机 寿命 试验 中 , “电视 机 寿命 小 于 1 万 小 时 ”与 
“电视 机 寿命 大 于 5 万 小 时 ”是 两 个 互 不 相 容 事件 ,因为 它们 不 可 能 同时 发 生 . 


图 1.1.4(a) A 与 8 互 不 相 容 图 1.1.4b> 多 个 事件 互 不 相 容 


两 个 事件 间 的 互 不 相 容 性 可 以 推广 到 多 个 事件 间 的 互 不 相 容 性 。 设 在 同 
一 个 试验 里 有 nn 个 事件 A Ac As 各 其 中 任意 两 个 事件 都 是 互 不 相 容 的 ， 
则 称 这 ?个 事件 互 不 相 容 , 见 图 1. 1.4(b)。 


1.1.6 事件 的 运算 

事件 的 基本 运算 有 四 种 :对 立 、 并 、 交 和 差 , 它 们 与 集合 的 余 、 并 、 交 和 差 是 
完全 一 样 的 。 

(1) 对 立 事件 . 设 4 为 一 个 试验 里 的 事件 , 则 由 不 在 4 中 的 一 切 基本 结果 
组 成 的 事件 称 为 4 的 对 立 事 件 , 记 为 4。 图 1.1.5 上 的 阴影 部 分 就 表示 4 的 
FHF 4。 可 见 ,A 就 是 “4 不 发 后”。 如 在 掷 一 颗 蜗 子 的 试验 中 ,事件 A= 
“出 现 偶数 点 ”的 对 立 事件 4= “出 现 奇数 点 >。 因 为 不 出 现 偶数 点 必 出 现 奇数 
=] o 


1.1.5 4 的 对 立 事件 A 


对 立 事 件 是 相互 的 ,4 的 对 立 事 件 是 A,A 的 对 立 事 件 必 是 4, 即 ASA, 
特别 ,必然 事件 0 与 不 可 能 事件 % 互 为 对 立 事件 。 即 万 =y, pA, 

(DEH A 与 B 的 并 。 是 由 事件 4 与 B 中 所 有 基本 结果 (相同 的 只 计 入 
一 次 ) 组 成 的 一 个 新 事件 , 记 为 4UB。 在 掷 一 颗 般 子 的 试验 中 ,事件 4 二 “出 
AHAA” = {1,3,5) 与 事件 B=“ 出现 点 数 不 超 过 3”= {1,2,3} 的 并 为 AUB 
= (1,2,3,5)。 可 见 ,事件 4 与 B 中 重复 元 素 只 须 记 入 并 事件 一 次 。 图 1.1.6 
是 事件 4 与 B 的 并 的 示意 图 。 从 图 上 可 见 , 并 事件 AUB 发 生意 味 着 “事件 4 
5 B 中 至 少 一 个 发 生 ”。 

从 对 立 事 件 的 定义 ( 见 图 1.1.5) 可 见 :AU 有 AA=0, 即 在 一 次 试验 中 4 与 A 
必 : 出 现 一 个 ， 

(3) 事 件 4 与 B 的 交 。 是 由 事件 4 与 B 中 公共 的 基本 结果 组 成 的 一 个 新 
事件 , 记 为 ANB 或 4B3。 如 在 搓 一 颗 最 子 的 试验 里 ,4= “出 现 奇数 点 ”一 (1， 
3,5} 与 事件 B==“ 出 现 点 数 不 超 过 3” 二 {1,2,3} 的 交 AB=(1,3), THA, 23 
事件 48 发 生 , 则 事件 4 与 B 必 同 时 发 生 ,反之 亦 然 。 图 1. 1. 7 是 交 事 件 AB 
的 示意 图 。 

T 


图 1.1.6 A 与 8B 的 并 图 1.1.7 A 与 8B 的 交 


AMF 4 S BEREK, M 4B=#, 反 之 亦 然 。 

OPH 4 对 B 的 差 。 是 由 在 事件 4 中 而 不 在 事件 B 中 的 基本 结果 组 成 
的 一 个 新 事件 , 记 为 AB. MAR TAREA 4= “出 现 奇数 点 ” 
一 {1,3,5} 对 事件 B==“ 出 现 点 数 不 超 过 3”= {1,2,3}) 的 差事 件 是 A4 一 B= 
(5}。 M B X A 的 差事 件 B 一 A4=={2)}。 这 是 两 个 不 同 的 差事 件 。 可 见 ,差事 件 
4 一 B 是 表示 事件 4 发 生 而 事件 B 不 发 生 这 样 一 个 事件 。 图 1. 1. 8(a) 与 (b) 
是 两 种 场合 下 差事 件 的 示意 图 。 从 图 1. 1. 8 可 以 看 出 ,A 一 B 一 A 一 AB==AB， 


BH 1.1.8(a) A—B E 1.1.8(b) A—BCADB) 


(5) 事 件 的 并 和 交 可 以 推广 到 更 多 个 事件 上 去 ( 见 图 1.1.9) 。 


图 1.1.9(a) A UAUA, El 1.1.9(b) 4,44; 


“n 个 事件 4 Aro An 中 至 少 有 一 个 发 生 ? 称 为 此 严 个 事件 的 并 , 记 为 
4iU4:U…U4, 或 U4;。 类 似 可 定义 可 列 个 事件 的 并 。 

a 个 事件 4 ,4，…,4。 同 时 发 生 ” 称 为 此 闫 个 事件 的 交 , 记 为 AAA, 
或 4A:。 类 似 可 定义 可 列 个 事件 的 交 

例 1.1.5 12 4,B,C 是 某 个 试验 中 的 三 个 事件 , 则 

(DFFA 与 BB 发 生 ,C 不 发 生 ” 可 表示 为 ABC, 

(2) 事 件 “A,B,C 中 至 少 有 一 个 发 生 ” 可 表示 为 4UBUC。 

(3) 事 件 “4,B,C 中 至 少 有 两 个 发 生 ” 可 表示 为 ABU BCU 4C。 

(4) 事 件 “4,B,C 中 恰好 发 生 两 个 ”可 表示 为 ABCUABCUABC, 

(5) 事 件 “4,B,C 中 有 不 多 于 一 个 事件 发 生 ” 可 表示 为 ABCUABCU 
ABCUABC., 


31.2 事件 的 概 奉 


1.2.1 事件 的 概率 

随机 事件 的 发 生 是 带 有 偶然 性 的 。 但 随机 事件 发 生 的 可 能 性 还 是 有 大 小 
之 别 的 ,是 可 以 设法 度量 的 。 而 在 生活 .生产 和 经 济 活动 中 人 们 很 关心 一 个 随 
机 事件 发 生 的 可 能 性 大 小 。 辟 如， 

(1) 抛 一 枚 硬币 ,出 现 正面 与 出 现 反 面 的 可 能 性 是 相同 的 ,各 为 1/2。 足球 
裁判 就 是 用 抛 硬 币 的 方法 让 双方 队长 选择 场地 ,以 示 机 会 均等 。 

(2) 某 厂 试 制 成 功 一 种 新 止痛 片 在 未 来 市 场 的 占有 率 是 多 少 呢 ?市 场 占 有 
率 高 ,就 应 多 生产 ,获得 更 多 利润 :市场 占 有 率 低 , 就 不 能 多 生产 ,否则 会 造成 
积压 ,不 仅 影 响 资金 周转 ,而 且 还 要 花 钱 去 贮存 与 保管 。 市 场 占 有 率 对 厂 长 组 
织 生 产 太 重要 了 。 

(3) 购 买 彩 券 的 中 奖 机 会 有 多 少 呢 ? 如 1993 年 7 月 发 行 的 青岛 啤酒 股票 
的 认购 券 共 出 售 287 347 740 张 ,其 中 有 180 000 张 认购 券 会 中 签 。 中 签 率 是 
万 分 之 6. 264( 见 1993 年 7 月 30 日 上 海 证 券 报 )。 

上 士 述 机 会 ,市 场 占有 率 .中签 率 以 及 常见 的 废品 率 、 命 中 率 、 男 役 儿 出 生 率 
等 都 是 用 来 度量 随机 事件 发 生 的 可 能 性 大 小 。 尽 管用 的 术语 不 同 ,但 其 共同 点 
是 用 0 到 1 间 的 一 个 数 (也 称 为 比率 ) 来 表示 一 个 随机 事件 发 生 的 可 能 性 大 
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小 。 在 概率 论 中 , 这 种 比率 就 是 概率 的 原形 。 为 了 使 这 种 比率 真正 成 为 概率 ， 
以 致 在 今后 概率 运算 中 不 引起 麻烦 ,还 需 对 这 种 比率 增加 某 种 可 加 性 的 要 求 。 
具体 请 看 下 面 给 出 的 概率 定义 。 

定义 1.2.1 在 一 个 随机 现象 中 ,用 来 表示 任 一 个 随机 事件 4 发 生 可 能 
性 大 小 的 实数 ( 即 比 率 ) 称 为 该 事件 的 概率 , 记 为 已 (4), 并 规定 

(1) 非 负 性 公理 ”对 任 一 事件 4, 必 有 PCO, 

(2) 正 则 性 公理 ”必然 事件 的 概率 PC(Q)=1， 

(3) 可 加 性 公理 大 4 与 A; 是 两 个 互 不 相 容 事件 ( 即 AA =g), MA 

P(A¡ UA) =P(A)+PCA?) 

这 就 是 著名 的 概率 的 公理 化 定义 ( 它 的 进一步 完善 将 在 $2.1.3 PR 
述 )。 在 这 个 定义 出 现 之 前 , 曾 有 过 概率 的 古典 定义 ,概率 的 统计 定义 、 概 率 的 
主观 定义 。 这 些 定义 各 适合 一 类 随机 现象 。 那 么 适合 一 切 随 机 现象 的 概率 的 
最 一 般 定 义 应 如 何 给 出 呢 ? 很 多 人 思索 过 这 个 问题 。1900 年 大 数学 家 希 尔 伯 
特 (1862 一 1943) 在 巴黎 第 二 届 国 际 数学 家 大 会 上 公开 提出 要 建立 概率 的 公理 
化 体系 。 即 从 概率 的 少数 几 条 性 质 出 发 来 刻 划 概率 的 概念 。 直 到 1933 年 ,前 
苏联 数学 家 柯 莫 哥 洛 夫 (1903 一 1987) 在 他 的 《概率 论 基本 概念 》( 丁 寿 田 译 ， 
1952) 一 书 中 首次 提出 上 述 概率 的 公理 化 定义 。 这 个 定义 概括 了 历史 上 几 种 概 
率 定 义 中 的 共同 特性 ,又 避免 了 各 和 目的 局 限 性 和 含混 之 处 ,不 管 什 么 随机 现 
象 ,只 有 满足 定义 中 的 三 条 公理 才能 说 它 是 概率 ,这 一 公理 化 体系 的 出 现 迅速 
获得 举世 公认 .为 现代 概率 论 发 展 打下 坚实 基础 ,从 此 数学 界 才 承认 概率 论 是 
数学 的 一 个 分 文 。 有 了 这 个 公理 化 体系 之 后 ,概率 论 得 到 很 快 发 展 。 这 个 公理 
化 体系 是 概率 论 发 展 史上 的 一 个 里 程 碑 。 

概率 的 公理 化 定义 虽 刻 划 了 概率 的 本 质 , 但 没有 告诉 人 们 如 何 去 确 定 概 
率 ,. 历 史上 概率 的 古典 定义 ,概率 的 统计 定义 和 概率 的 主观 定义 都 有 各 自 确定 
概率 的 方法 。 所 以 ,在 有 了 公理 化 定义 之 后 ,把 它们 看 作 确 定 概率 的 三 种 方法 
倒是 很 恰当 的 。 下 面 先 介绍 排列 与 组 合 公 式 , 然 后 将 分 别 叙 述 这 些 方 法 。 


12.2 排列 与 组 合 概要 
排列 与 组 合 是 两 类 计数 公式 。 它 们 的 推导 都 基于 如 下 两 条 计数 原理 ， 
ORARE ”如果 某 件 事 需 经 个 步骤 才能 完成 ,做 第 一 步 有 m 种 方 
法 ,做 第 二 步 有 mz 种 方法 ,… ,做 第 DA m 种 方法 ,那么 完成 这 件 事 共有 
MX 7122 X °X Mk 种 方法 。 
辟 如 , 甲 城 到 乙 城 有 3 条 旅游 线路 ,由 乙 城 到 丙 城 有 2 条 旅游 线路 ,那么 
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从 甲 城 经 乙 城 去 两 城 共有 3X2=6 条 旅游 线路 。 

《2) 加 法 原理 ”如果 某 件 事 可 由 上 类 不 同 办 法 之 一 去 完成 ,在 第 一 类 办 法 
中 又 有 m 种 完成 方法 ,在 第 二 类 办 法 中 又 有 m MERTE, ,第 和 类 办 
法 中 又 有 m 种 完成 方法 ,那么 完成 这 件 事 共有 mtm ttm 种 方法 。 

例如 ,由 甲 城 到 乙 城 去 旅游 有 三 类 交通 工具 :汽车 .火车 和 飞机 。 而 汽车 有 
5 个 班次 ,火车 有 3 个 班次 ,飞机 有 2 个 班次 ,那么 从 甲 城 到 乙 城 共有 5 十 3 十 2 
=10 个 班次 供 旅 游 者 选择 。 

DHI ”从 个 不 同 元 素 中 任 取 xlr 志 nn) 个 元 素 排 成 一 列 称 为 一 个 排 
列 , 按 梯 法 原理 ,此 种 排列 共有 nnX x 一 1)X…Xx 一 r 十 了 个 , 记 为 Po r= 
zy 称 为 全 排列 ,全 排列 数 共 有 n! 个 , 记 为 Pae 

(4) 重 复 排列 从 ”个 不 同 元 素 中 每 次 取出 一 个 , 放 回 后 再 取 下 一 个 ,如 
此 连续 取 r 次 所 得 的 排列 称 为 重复 排列 ,此 种 重复 排列 数 共 有 nn’ 个。 注意 ,这 
里 的 > 允许 大 于 nn。 

(5) 组 合 ”从 个 不 同 元 素 中 任 取 xr(r 才 nn) 个 元 素 并 成 一 组 (不 考虑 其 间 
顺序 ) 称 为 一 个 组 合 , 按 乘法 原理 ,此 种 组 合 总 数 为 


Ú _E,_nín— 1) (n—r+1) n! 

r ri 六 | rt (n—r)! 

并 规定 0 一 1 和 | "| =1, 这 里 的 | "] 还 是 二 项 式 展开 式 的 系数 , 即 
a+oy=>3|" ap 

若 在 上 式 中 令 a 一 5b 二 1, 可 得 一 重要 组 合 恒等式 ， 
Ape 


(6) 重 复 组 合 从 个 不 同 元 素 中 每 次 取出 一 个 , 放 回 后 再 取 下 一 个 ,如 
此 连续 取 次 所 得 的 组 合 称 为 重复 组 合 。 此 种 重复 组 合 总 数 为 | ”+ ”| 


上 述 四 种 排列 组 合 及 其 总 数 计算 公式 将 在 古典 概率 计算 中 经 常 使 用 ,这 
里 不 再 举例 说 明 , 但 应 指出 ,在 使 用 中 要 注意 识别 有 序 与 无 序 、 重 复 与 不 重复 、 


Q 


1.2.3 古典 方法 
古典 方法 是 在 经 验 事实 的 基础 上 对 被 考察 事件 发 生 可 能 性 进行 符合 逻辑 
分 析 后 得 出 该 事件 的 概率 。 这 种 方法 简单 .直观 .不 需要 做 试验 ,但 只 能 在 一 类 
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特定 随机 现象 中 使 用 。 其 基本 思想 如 下 : 
(1) 所 涉及 的 随机 现象 只 有 有 限 个 基本 结果 。 不 妨 设 基本 空间 Q= (w, 
03106) AP n 为 其 基本 第 果 的 总 数 。 | 
《2) 每 个 基本 结 采 出 现 的 可 能 性 是 相同 的 (简称 等 可 能 性 ) .确定 一 个 随机 
现象 的 每 个 基本 结果 是 等 可 能 的 ,常任 经 验 事实 和 进行 符合 逻辑 的 分 析 .。 璧 如 
在 撕 骨 子 试验 中 ,如 果 骨 子 是 均匀 的 正六 面体 , 那 就 没有 理由 认为 其 中 一 面 出 
现 机 会 比 男 一 面 更 多 一 些 。 故 认为 髓 子 各 面 出 现 的 机 会 是 等 可 能 的 。 
(3) 假 如 被 考察 的 事件 4 含有 个 基本 结果 ， ON A 的 概率 就 是 
P(A) 一 = 全 中 合 芝 本 绽 (1.2.1) 
n O 中 基本 结果 E 
这 种 确定 概率 的 方法 曾 是 概率 论 发 展 初期 的 主要 方法 , 故 所 得 概率 又 称 
为 古典 概率 。 它 满足 概率 定义 1.2. 1 中 的 三 条 公理 。 非 负 性 公理 是 显然 满足 
的 。 必 然 事件 概率 PORRA 2. 1) 式 计算 必 为 azm 一 1, 故 正则 性 公理 成 立 。 最 
后 ,对 两 个 互 不 相 容 事件 A MA EA 


P(A)=", P(A,)=— 
这 表明 ,事件 41 和 4; 分别 含有 & 和 ,个 基本 结果 ,由 于 hi 与 4, 互 不 相 
容 , 故 在 十 ks 个 基本 结果 中 没有 相同 的 基本 结果 ,所 以 并 事件 A UA 含有 
有 i 十 kz 个 基本 结果 。 这 样 一 来 ,可 得 | 
ki 十 k， 


P(A U A;,)= 


故 可 加 性 公理 成 立 。 

下 面 一 些 例 子 说 明 如 何 用 (1. 2. 1) 式 去 计算 古典 概率 。 这 要 涉及 到 一 些 排 
列 与 组 合 的 知识 。 

例 1. 2. 1( 扑 克 游 戏 ) ”一 副 标 准 的 扑克 牌 由 52 张 组 成 , 它 有 两 种 颜色 、 
四 种 花 式 和 13 种 牌 形 。 具 体 分 布 如 表 1. 2. 1 所 示 。 

假如 52 张 牌 的 大 小 .厚度 和 外 形 完 全 一 样 ( 一 般 的 扑克 牌 都 满足 这 -_- 一 条 
件 ), 那 末 52 张 牌 中 任 一 张 被 抽出 的 可 能 性 是 相同 的 ,我 们 来 研究 下 面 一 些 事 
件 的 概率 。 / 

(1) 事 件 4==“ 抽 出 一 张 红 牌 ”在 抽 一 张 牌 试验 中 ,共有 52 种 等 可 能 基本 
结 采 ,其 中 红牌 有 26 张 (13 张 红 心 和 13 张 红 方 块 ) 。 故 事件 4 的 概率 为 


=P(AD)+P(A,) 
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表 1.2.1 标准 扑克 牌 的 分 布 


DE 红心 ETE 红 方 块 
A A A A 
K .K K K 
Q Q Q Q 
J J J 
10 10 10 10 
9 9 9 9 
8 8 8 8 
7 7 7 7 
6 6 6 6 
5 5 5 5 
4 4 4 4 
3 3 3 3 
2 2 2 2 


(2) 事 件 B==“ 抽 出 一 张 不 是 红心 ”在 这 个 抽 牌 试验 中 , 亦 有 52 种 等 可 能 
基本 纤 采 , 但 不 是 红心 的 牌 只 有 39 张 , 故 事件 B 的 概率 为 


932 4 | 
(3) 事 件 C 一 “抽出 二 张 红 心 牌 ”在 这 个 抽 二 张 牌 的 试验 中 ,共有 [52 个 
等 可 能 基本 结果 。 其 中 二 张 牌 全 是 红心 必须 在 13 张 红 心 牌 中 抽取 才能 使 事件 
C 发 生 。 故 事件 C 所 包含 的 基本 结果 总 数 为 | | 个 。 故 


Fl 
2 13 久 12 1 


2 
(OFF D=“ 抽 出 二 张 不 同 颜色 的 牌 ”。 在 这 个 抽 二 张 牌 的 试验 中 , 亦 有 


个 等 可 能 基本 结果 ,要 获得 二 张 不 同 颜 色 的 牌 ( 即 事件 D 发 生 ) 可 以 设想 


分 二 步 完 成 此 事 ,第 一 步 从 26 张 红 牌 中 任 取 1 张 ,第 二 步 再 从 26 张 黑 牌 中 任 
取 1 张 。 依 据 乘 法 原则 ,要 获 二 张 不 同 颜色 的 牌 共 有 26X 26 种 基本 结果 , 故 


| 52 
12 


1 


2 
可 见 ,事件 D 比 事件 C 发 生 的 概率 要 高 达 8. 7 倍 。 
13 


65) 事件 巨 =“ 抽出 二 张 同 花 式 的 牌 "。 在 这 个 抽 二 张 牌 的 试验 中 , 仍 有 
| 型 | 个 等 可 能 基本 结果 。 要 获得 二 张 同 花 式 的 牌 可 以 有 四 种 方式 得 到 。 


第 一 种 方式 ,从 13 张 黑 桃 中 任 取 二 张 , 共 有 | | 种 可 能 ， 
第 二 种 方式 ,从 13 张 红 心中 任 取 二 张 ,共有 | :2 | 种 可 能 ， 
第 三 种 方式 ,从 13 张 章 花 中 任 取 二 张 , 共 有 | | 种 可 能 ， 
第 四 种 方式 ,从 13 张 方块 中 任 取 二 张 ,共有 | .| 种 可 能 ， 


依据 加 法 原则 ,要 获得 二 张 同 花 式 的 牌 共有 | :| +| ?+| 33| 上 +| 23j = 


4 | 屿 | 种 基本 结果 , 故 


(6) 事 件 下 一 “抽出 5 张 ,恰好 是 同花顺 ”在 这 个 抽 5 张 牌 的 试验 中 ,共有 
| 2] 个 等 可 能 基本 结果 。 要 获得 5 张 同 花 顺 的 牌 可 以 有 四 种 方式 ( 即 四 种 花 


式 ) 得 到 ,并 且 这 四 种 方式 获得 的 同花顺 的 基本 结果 数 是 相同 的 , 现 以 黑 桃 花 
式 为 例 。 要 得 到 同花顺 ,只 有 以 下 10 种 基本 结果 ， 

AKQJ10 KQJ109 QJ1098 

J10 98 7 1098 76 98 765 

87654: 76543 65 432 

5 432A 
依据 加 法 原则 ,要 获得 5 张 同 花 顺 的 牌 共 有 4X 10=40 种 基本 结果 。 故 


EI 00001539 


5 
这 个 概率 是 很 小 的 , 仅 有 10 万 分 之 1.5。 此 类 事件 被 称 为 稀有 事件 。 
(7) 事 件 C= “抽出 13 张 同 花 式 的 牌 ”。 在 这 个 抽 13 张 牌 的 试验 中 ,共有 


| 2 个 等 可 能 基本 结果 。 其 中 同 花 式 的 只 有 4 种 , 即 全 是 黑 桃 ,全 是 红 桃 .全 
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是 草花 、 全 是 方块 , 履 


9% 
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这 个 概率 是 非常 小 的 ,几乎 不 可 能 发 生 。 假如 在 一 次 扑克 游戏 中 ,事件 G AE 
了 ,在 惊讶 之 余 有 人 会 怀疑 在 做 牌 ,这 种 怀疑 不 是 没有 道理 的 。 

在 扑克 游戏 中 会 遇 到 很 多 有 趣 的 随机 事件 .读者 可 以 举 出 很 多 例子 ,并 试 
算 它 们 的 概率 。 

例 1. 2. 2( 随 机 抽样 ) ”一 批 产品 共有 N 个 ,其 中 不 合格 品 有 M 个 , 现 从 
中 随机 取出 x 个, 问 事件 4,=“ 恰 好 有 zx 个 不 合格 品 ” 的 概率 是 多 少 ? 


从 N 个 产品 中 随机 取出 个 只 有 | ”种 基本 结果 。 其 中 “随机 取出 ” 必 导 


IN 1587 x10 


致 这 | ”| 种 基本 结果 是 等 可 能 的 。 以 后 对 “随机 ”一 词 亦 可 作 同 样 理解 。 下 面 
我 们 先 计算 事件 AoA: 的 概率 ,然后 再 计算 一 般 事件 A 的 概率 ， 
事件 4, 二 “恰好 有 0 个 不 合格 品 ”一 “全 是 合格 品 ”。 要 使 取出 的 个 产品 


全 是 合格 品 , 那 必须 从 NM 个 合格 品 中 抽取 ,这 有 | ^ 一 “| 种 取 法 ,故事 伯 
Ao 的 概率 为 
NÓ 
on 
事件 41 一 “恰好 有 1 个 不 合格 品 ”, 要 使 取出 的 个 产品 中 只 有 一 个 不 合 
格 品 ,其 它 4 一 1 个 是 合格 品 , 那 要 分 二 步 抽取 。 第 一 步 从 M 个 不 合格 品 中 随 


机 取出 1 个 ,共有 | | 种 取 法 ;第 二 步 从 NM 个 合格 品 中 随机 取出 n 一 1 
一] 种 


n—1 


P(A)= 


个 ,共有 | 外] 种 取 法 。 依 据 乘法 原则 ,要 使 4, 出 现 共有 | Y 
基本 结果 。 故 事件 A 的 概率 为 | 
M NM) 
Pr(4 1 一- 一] 
ES 
要 使 事件 An 发生, 必须 从 M 个 不 合格 品 中 抽 m 个 ,而 从 N 一 M 个 合格 
品 中 抽 n 一 m 个 ,依据 乘法 原则 ,要 使 An 发 生 的 基本 结果 共有 
15 


NI | 个 ,故事 件 An 的 概率 是 
E. 


NM) 
P CAm) = 


4 
这 里 要 求 m 志 MM,n 一 m 志 NN 一 MM, 否 则 概率 为 0, 因 为 它们 是 不 可 能 事件 。 而 命 
题 “ 不 可 能 事件 的 概率 为 0” 将 在 下 节 由 三 条 公理 推 得 。 
假如 给 定 N= 二 10,M==2,n 二 4, 我 们 来 计算 诸 An 的 概率 
10.2 /| 10 
4 4 


pCa)=|2) 1021/0090. 5333 


Pca) =| 2 | 1072 /| 10 =0. 1334 

而 As) A 等 都 是 不 可 能 事件 。 因 为 10 个 产品 中 只 有 2 个 不 合格 品 ,而 要 
从 中 抽出 3 件 或 4 件 不 合格 品 , 这 是 不 可 能 的 。 

例 1. 2.3( 放 回 抽 样 ) 抽样 有 二 种 方式 :不 放 回 抽样 与 放 回 抽样 。 例 
1. 2.2 谈 的 是 不 放 回 的 抽样 ,每 次 抽取 一 个 ,不 放 回 ,再 抽 第 二 个 ,这 相当 于 > 
个 同时 取出 ,因此 可 不 论 其 次 序 . 放 回 抽 样 (又 称 还 原 抽样 ) 是 抽 一 个 , 放 回 后 ， 
骨 抽 下 一 个 ,这 时 要 讲究 次 序 , 现 对 例 1. 2. 2 采取 放 回 抽样 讨论 事件 Ba = “te 
好 有 m 个 不 合格 品 ” 的 概率 。 

MAN 个 产品 中 每 次 抽 一 个 检查 , 放 回 后 再 抽 第 二 个 ,直至 抽出 第 ”个 检 
得 ,共有 N 种 等 可 能 的 基本 结果 。 

事件 B。= 二 “全 是 合格 品 ” 发 生 必须 从 N 一 M 个 合格 品 中 用 放 回 抽样 抽 n 
次 ,共有 (CN 一 MM)" 种 基本 结果 , 故 

Peo = LES 14] 

事件 B= 二 “恰好 有 1 件 不 合格 品 ” 发 生 必须 从 N 一 M 个 合格 品 中 用 放 回 
抽样 抽 一 1 次 ,从 MM 个 不 合格 品 中 抽 一 次 。 这 样 就 有 M + (CN 一 MD) 一 :种 取 
法 。 再 考虑 到 不 合格 品 可 能 在 第 一 次 抽样 中 出 现 , 也 可 能 在 第 二 次 抽样 中 出 
现 ,……: ;也 可 能 在 第 次 抽样 中 出 现 , 故 总 的 基本 结果 共有 n，M. (N— 


| =0. 3333 


PCA) = 


nM(N—My o? M 
Cp n N 


P(B,)= KaK 


事件 Bn 的 发 生 共 有 | ”| MONM AERAR, APARA 
| 地] 是 由 于 考虑 到 m 个 不 合格 品 可 能 出 现在 次 放 回 抽样 中 任何 加 次 所 致 。 


故 


ÓN 


这 里 mm AUR 0,1,» m. FANS m=n HB PCB, )=(M/NY, 


á 
PB.) =| 1 一 之 | 一 0.8 一 0. 4096 


P(B.)=4X0.2X0.8*=0. 4096 
P(B:)=6X0. 27X0. 8*=0, 1536 
P(B3)=4X0.2%x0.8=0. 0256 
P(B)=0.2*=0. 0016 
可 见 ,在 放 回 抽样 中 ,Bo 和 B, 发 生 的 可 能 性 最 大 ,而 Bs 发生 的 可 能 性 要 小 得 
多 ,在 一 干 次 中 还 不 到 二 次 。 | 


PB.) =| É 
tri 


1.2.4 频率 方法 

频率 方法 是 在 大 量 重复 试验 中 用 频率 去 获得 概率 近似 值 的 一 个 方法 。 雍 
是 最 常用 ,也 是 最 基本 的 获得 概率 的 方法 。 频 率 方法 的 基本 思想 如 下 : 

(1) 与 考察 事件 4 有 关 的 随机 现象 是 允许 进行 大 量 重复 试验 的 。 

《2) 假 如 在 N 次 重复 试验 中 ,事件 AREK 次 , 则 事件 4 发 生 的 频率 为 

pica = Er FA RENN (1. 2. 2) 
N 重复 试验 次 数 

频率 PN (4) 确 能 反映 事件 4 发 生 可 能 性 的 大 小 ,Pi OKERE 4 发 生 的 
可 能 性 大 ,Pw (4A) 小 反映 着 A 发 生 的 可 能 性 小 。 另 外 ,频率 还 具有 非 负 性 , 必 
然 事 件 0 的 频率 必 为 1, 而 对 任意 两 个 互 不 相 容 事件 4, 与 4,, 若 在 V 次 重复 
试验 中 ,A 出 现 KP R, A 出 现 天 2 次 ,那么 并 事件 AUA 在 这 N 次 重复 
试验 中 必 出 现 KK 站 十 KY 次 ,从 而 其 频率 有 


Ko KSD 
SNEEN L Pi (A) HPA CA) 


ARES A JE TPE, E MER TIHE. 
(3) 频 率 Px (4) 依 赖 于 重复 次 数 N。 HEAR N, RF 4 的 频率 会 不 同 ,但 
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Pn CA; LU A,)= 


人 们 的 长 期 实践 表明 , 随 着 重复 次 数 N 的 增加 ,频率 PA AREA A 
数 附近 ( 见 例 1.2.4), 这 个 频率 的 稳定 值 已 与 N 无 关 , 它 就 是 事件 4 发 生 的 
概率 P(A)。 由 频率 的 性 质 可 以 看 到 其 稳定 值 ( 即 概率 ) 亦 有 类 似 性 质 。 

(4) 在 现实 世界 里 ,我 们 无 法 把 一 个 试验 无 限 次 地 重复 下 去 ,因此 要 获得 
事件 4 发 生 的 频率 的 稳定 值 P(4) 是 件 很 难 的 事情 。 但 在 重复 次 数 NRK 
时 ,频率 Pi (4) 就 很 接近 概率 P(4)。 在 统计 学 中 把 频率 称 为 概率 的 估计 值 ， 
在 实际 中 频率 常 当 作 概 率 近 似 值 使 用 , 璧 如 ,在 足球 比赛 中 , 罚 点 球 是 一 个 扣 
ARANDA) ATAR 4 二 “ 罚 点 球 射 中 球门 ”, A 的 概率 , 即 判 罚 点 球 的 命 
FP P(4) 是 多 少 ? 这 可 以 通过 重复 试验 所 得 数据 资料 计算 频率 而 得 概率 估 
计 值 ,曾经 有 人 对 1930 年 至 1988 年 世界 各 地 53274 场 重 大 足球 比赛 作 了 统 
计 , 在 判罚 的 15382 个 点 球 中 ,有 11172 个 射 中 ,频率 为 11172/15382 = 
0. 726 ,这 束 是 罚 点 球 命中 概率 P(4) 的 估计 值 。 

例 1.2.4 说 明 频率 稳定 性 的 例子 。 

(1) 在 撕 一 枚 均匀 硬币 时 ,古典 概率 已 给 出 ,出 现 正面 的 概率 为 0.5。 为 了 
验证 这 一 点 ,每 个 人 都 可 以 作 大 量 的 重复 试验 ,图 1. 2. 1 记录 了 前 400 YC PERE 
币 试 验 中 频率 P" (正面 ) 的 波动 情况 ,在 重复 次 数 N 较 小 时 ,已 “波动 剧烈 , 随 
者 N 的 增 大 , 己 * 波 动 的 幅度 在 逐渐 变 小 。 历 史上 有 不 少 人 做 过 更 多 次 重复 试 
验 。 其 结果 ( 见 表 1. 2.2) 表 明 ,正面 出 现 的 频率 逐渐 稳定 在 0.5。 这 个 0.5 就 是 
频率 的 稳定 值 ,也 是 正面 出 现 的 概率 。 这 与 用 古典 方法 计算 的 概率 是 相同 的 。 


p* 


0.0 ! N 
1 2 5 10 20 50 100 400 


图 1.21 RMB, ENRICO LR 
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表 1.2.2 掷 一 枚 鲁 币 ,正面 出 现 的 频率 


实验 者 掷 硬币 次 数 正面 出 现 次 数 频率 

清 来 4 040 2 048 0. 5069 
皮尔 还 12 000 6 019 0. 5016 

ERA 24 000 1 2012 0. 5005 


注 ; 此 表 引 自 格 涅 坚 科 《 概 率 论 教程 ), 高 等 教育 出 版 社 ,1957，。 


(2) 在 英语 中 某 些 字母 出 现 的 频率 远 高 于 另外 一 些 字母 .人 们 对 各 类 典型 
的 类 博 书 刊 中 字母 出 现 的 频率 进行 了 统计 。 发 现 各 个 字母 的 使 用 频率 相当 稳 
定 。 其 使 用 频率 见 表 1. 2. 3。 这 项 研究 对 计算 机 键盘 设计 (在 方便 的 地 方 安排 
使 用 频率 较 高 的 字母 健 ). 印 刷 铅字 的 铸造 (使 用 频率 高 的 字母 应 多 铸 一 些 )、 
信息 的 编码 (使 用 频率 高 的 字母 用 较 短 的 码 )、 密 码 的 破译 等 等 方面 都 是 十 分 
有 用 的 。 | 


R123 英语 字母 使 用 频率 


Fu 频率 F 频率 字母 频率 
EE 0. 130 D 0. 044 G 0.014 | 

T 0. 090 L 0. 036 B 0. 013 
O 0. 08] C 0. 029 yV 0. 010 
A 0. 078 F 0. 028 K 0. 004 
N 0. 073 U 0. 028 X 0. 003 
I 0. 068 M 0. 026 J 0. 001 
R 0. 067 P 0. 022 Q 0. 001 
S 0. 065 Y 0. 015 Z 0. 001 
H 0. 058 W 0. 015 


1E: 518 L. Birllouin ,Science and Information Theory, New York,1956. 


(3) 频 率 的 稳定 性 在 人 口 统计 方面 表现 得 较为 明显 。 拉 普 拉 斯 (1794~ 
1827) 在 他 的 名 著 《 概 率 论 的 哲学 探讨 ) 中 研究 了 男 婴 出 生 的 频率 。 他 对 伦敦 、 
彼得 堡 、 柏 林 和 全 法 国 的 大 量 人 口 资料 进行 研究 ,发 现 男 婴 出 生 频 率 几乎 完全 
一 致 ,并 且 这 些 男 婴 出 生 频 率 总 在 一 个 数 左右 波动 ,这 个 数 大 约 是 22/43. F 
外 一 位 统计 学 家 克拉 梅 (1893 一 1985) 在 他 的 名 著 《 统 计 学 数学 方法 }( 上 海 科 
技 出 版 社 ,1966) 中 引用 了 瑞典 1935 年 的 官方 统计 资料 ( 见 表 1. 2. 4) ,该 资料 
表明 , 女 婴 出 身 的 频率 总 是 稳定 在 0.482 左右 。 


1.2.5 主观 方法 
在 现实 世界 里 有 一 些 随 机 现象 是 不 能 重复 的 或 不 能 大 量 重复 的 ,这 时 有 
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关 事 件 的 概率 如 何 确定 呢 ? | 
统计 界 有 一 个 贝 叶 斯 人 (1702 一 1761) 学 派 ,他 们 在 研究 了 这 些 随机 现象 后 
认为 :一 个 事件 的 概率 是 人 们 根据 经 验 对 该 事件 发 生 可 能 性 所 给 出 的 个 人 信 
念 。 这 样 给 出 的 概率 称 为 主观 概率 。 黎 如 : 
R124 瑞典 1935 年 各 月 出 生 岗 儿 性 别 统计 


月 份 1 2 3 4 5 6 
总 数 7 280 6 957 7 883 7 884 7 892 7 609 
IE 3 537 3 407 3 866 3 711 3 775 3 665 
频率 0. 486 0. 489 O. 490 0. 471 0. 478 0. 482 

月 份 了 8 9 10 11 12 全 年 


总 数 7 585 7 393 7 203 6 903 6 552 7132 88273 
ZE 3 621 3 596 3 491 3 391 3 160 3 371 42 591 
频率 0. 462 0. 484 0. 485 0. 491 0. 482 0. 473 0. 4825 


一 个 企业 家 认为 “一 项 新 产品 在 未 来 市 场 上 畅销 ”的 概率 是 0.8。 这 里 的 
0. 8 是 根据 他 自己 多 年 经 验 和 当时 的 一 些 市 场 信息 综合 而 成 的 个 人 信念 。 

一 位 投资 者 认为 “购买 某 种 股票 能 获得 高 收益 ”的 概率 是 0. 6, 这 里 的 0. 6 
是 投资 者 根据 自己 多 年 股票 生意 经 验 和 当时 股票 行情 综合 而 成 的 个 人 信 

一 位 脑 外 科 医 生 要 对 一 位 病人 动手 术 , 他 认为 成 功 的 概率 是 0. 9, 这 是 他 
根据 手术 的 难 易 程度 和 自己 的 手术 经 验 而 对 “手术 成 功 ” 所 给 出 的 把 握 程 度 。 

一 位 教师 认为 甲 学 生 考取 大 学 的 概率 是 0. 95, 而 乙 学 生 考取 大 学 的 概率 
是 0.5。 这 是 教师 根据 自己 多 年 的 教学 经 验 和 甲乙 二 位 学 生 的 学 习 情 况 而 分 
别 给 出 的 个 人 信念 。 

这 样 的 例子 在 我 们 生活 、 生 产 和 经 济 活动 中 也 是 常 遇见 的 ,他 们 给 出 的 主 
观 概率 决 不 是 随意 的 ,而 是 要 求 当事人 对 所 考察 的 事件 有 和 较 透 彻 的 了 解 和 丰 
富 的 经 验 , 甚 至 是 这 一 行 的 专家 ,并 能 对 周围 信息 和 历史 信息 进行 仔细 分 析 ， 
在 这 个 基础 上 确定 的 主观 概率 就 能 符合 实际 .所 以 应 把 主观 概率 与 主观 脐 造 、 
上 暑 说 一 通 区 别 开 来 ,在 某 种 意义 上 说 ,不 利用 这 些 丰 富 的 经 验 去 确定 概率 也 是 
一 种 浪费 。 

对 主观 概率 的 批评 也 是 有 的 ,50 年 代 苏 联 数学 家 格 涅 坚 科 在 他 的 《概率 
论 教程 ?中 说 ,“ 把 概率 看 作 是 认识 主体 对 事件 的 信念 的 数量 测度 , 则 概率 论 成 
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了 类 似 心理 学 部 门 的 东西 ,这 种 纯 主 观 的 概率 主张 贯彻 下 去 的 话 , 最 后 总 不 可 
避免 要 走 到 主观 唯心 论 的 路 上 去 。” 这 种 担心 不 能 说 不 存在 ,但 以 经 验 为 基础 
的 主观 概率 与 纯 主观 还 是 不 同 的 ,何况 主观 概率 也 要 受到 实践 检验 ,也 要 符合 
概率 的 三 条 公理 ,通过 实践 检验 和 公理 验证 ,人 们 会 接受 其 精华 ,去 其 糟粕 。 

自主 观 概率 提出 以 来 ,使 用 的 人 愈 来 愈 多 ,特别 在 经 济 领域 和 决策 分 析 中 
使 用 较为 广泛 ,因为 在 那里 遇 到 的 随机 现象 大 多 是 不 能 大 量 重复 ,无 法 用 频率 
方法 去 确定 事件 概率 ,在 这 个 意义 上 看 ,主观 概率 至 少 是 频率 方法 和 古典 方法 
的 一 种 补充 ,有 T 了 主观 概率 至 少 使 人 们 在 频率 观点 不 适用 时 也 能 谈论 概率 ,使 
用 概率 与 统计 方法 。 

主观 概率 的 确定 除根 据 自 己 的 经 验 外 ,还 可 利用 别人 经 验 和 历史 资料 在 
对 比 中 形成 主观 概率 ,下 面 两 个 例子 具体 说 明 这 种 方法 。 

例 1.2.5 有 一 项 市 有 风险 的 生意 ,和 欲 估计 成 功 ( 记 为 4) 的 概率 。 为 此 决 
策 痢 去 拜访 这 方面 的 专家 (如 董事 长 .银行 家 等 ), 向 专家 提 这 样 的 问题 ;“ 如 果 
这 种 生意 做 100 次 ,你 认为 会 成 功 几 次 ?” 专 家 回答 “成 功 次 数 不 会 太 多 ,大 约 
60 "AE PC(4)==0.6 是 专家 的 主观 概率 ,可 此 专家 还 不 是 决策 者 。 但 决策 
者 很 熟悉 这 位 专家 ,认为 他 的 估计 往往 是 偏 保守 的 ,过 分 并 慎 的 。 决 策 者 决定 
修改 专家 的 估计 ,把 0. 6 提高 到 0.7。 这 样 P(4)=0. 7 就 是 决策 者 的 主观 概率 ， 

这 种 用 专家 意见 来 确定 主观 概率 的 方法 是 常用 的 。 当 决策 者 对 某 事件 了 
解 甚 少时 ,就 可 去 征求 专家 意见 。 这 里 要 注意 二 点 ;一 是 向 专家 提 的 问题 要 设 
计 好 , 既 要 使 专家 易 懂 , 又 要 使 专家 回答 不 是 模棱两可 ;二 是 要 对 专家 本 人 较 
为 了 解 ,以 便 作 出 修正 ,形成 决策 者 自己 的 主观 概率 ， 

例 1.2.6 某 公 司 经 营 儿 童 玩具 多 年 , 今 设 计 了 一 种 新 式 玩 具 将 投入 市 
场 。 现 要 估计 此 新 式 玩具 在 未 来 市 场 上 的 销售 状况 。 经 理 查阅 了 本 公司 过 去 
37 种 新 式 玩 具 的 销售 记录 ,得 知 销售 状态 是 轧 销 (4,) .一 般 (4:)、 潍 销 (4;) 分 
别 有 29,6,2 种 ,于 是 算得 过 去 新 式 玩 具 的 三 种 销售 状态 的 概率 分 别 为 


29 _ 6 o 2 
37 一 0.784， 37 一 0.162， 六 一 0. 054 


考虑 到 这 次 设计 的 新 玩具 不 仅 外 形 新 颖 ,而 且 在 开发 儿童 智力 上 有 显著 突破 ， 
经 理 认为 此 种 新 玩具 会 更 畅销 一 些 ,滞销 可 能 性 更 小 , 故 对 上 述 概 率 作 了 修 
改 , 提 出 目 己 的 主观 概率 如 下 : 
P(A¡)=0.85, PCA¿)=0.14, P(A,)=0.01 
这 个 例子 表明 ,假如 有 历史 数据 ,要 尽量 利用 ,帮助 形成 初步 概念 ,然后 作 
一 些 对 比 、 修 正 , 再 形成 个 人 信念 ,这 对 给 出 主观 概率 大 有 好 处 。 
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依据 经 验 和 历史 资料 等 先 验 信息 给 出 的 主观 概率 没有 什么 固定 的 模式 ， 
但 所 确定 的 主观 概率 都 必须 满足 概率 的 三 条 公理 ,发 现 与 三 条 公理 及 其 性 质 
有 不 和 谐 之 处 ,必须 立即 修正 ,直到 和 谐 为 止 。 这 时 给 出 的 主观 概率 才能 称 得 
上 概率 ( 详 见 例 1. 3. 5)。 


$1.3 HEBE IA 


利用 概率 的 三 条 公理 可 以 推出 概率 的 所 有 性 质 ,这 里 把 一 些 常用 性 质 推 
导出 来 ,还 有 一 些 性 质 在 以 后 章节 中 逐步 导出 。 
定理 1.3.1 对 任 一 事件 4, 有 
P(A)=1—P(A) 
证 :因为 4 与 4 互 不 相 容 , 且 4U4=9Q, 故 由 可 加 性 公理 和 正则 性 公理 
可 得 
PA FP =P =1 
移 项 后 即 得 所 要 结果 。 
定理 1.3.2 不 可 能 事件 #$ 的 概率 为 0, 即 P($)=0。 
证 :因为 不 可 能 事件 $ 与 必然 事件 Q 互 为 对 立 事件 , 故 
P(#$)=1—P(0Q)=0 
例 1.3.1 抛 两 榴 硬币 ,至 少 出 现 一 个 正面 ( 记 为 事件 4A,) 的 概率 是 多 少 ? 
解 : 抛 两 枚 硬币 共有 四 个 等 可 能 基本 结果 : 
( 正 , 正 ),( 正 , 反 ),( 反 , 正 ),( 反 , 反 ) 
事件 4; 含有 其 中 前 三 个 基本 结果 , 故 P(A,) 二 3/4, 作 为 讨论 我 们 来 考察 A, 
的 对 立 事 件 A;, 它 的 含义 是 
4, 二“ 抛 两 枚 硬币 ,都 出 现 反 面 ”。 
它 只 含 一 个 基本 结果 (有 反 , 反 ), 于 是 P(A4,)==1/4, 再 用 定理 1. 3. 1, 可 得 


PCA)=1P(A)=1=-=0. 75 


由 此 可 见 , 两 条 不 同 思路 获得 相同 结果 ,但 相 比 之 下 ,后 一 条 思路 更 容易 实现 
些 , 因 为 A 所 含 的 基本 结果 比 A 所 含 基本 结果 要 少 一 些 ,从 而 计算 也 容易 
一 些 , 这 种 思路 在 抛 更 多 枚 硬币 时 更 易 显 露出 其 方便 的 特点 , 辟 如 在 抛 五 枚 硬 
币 时 ,至 少 出 现 一 个 正面 ( 记 为 4;) 的 概率 为 
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因为 对 立 事件 4; 表示 “五 枚 硬币 都 出 现 反 面 ”, 它 在 天 =32 个 等 可 能 结果 中 
仅 含 其 中 一 个 , 故 很 易 算 得 PA=, 
定理 1.3.3 对 nn 个 互 不 相 容 事件 4 ,… An A 


PLUAD= 2 PA) 
证 :在 x 二 3 时 ,任意 三 个 互 不 相 容 事件 的 并 可 改写 为 
AiUA;U A;= (CA: U A2) U A; 
并 且 并 事件 A UA: 5 A: 仍 为 互 不 相 容 的 事件 ,于 是 由 可 加 性 公理 得 
PCU AUA =P, UA) +P(A) 
=P(4A:)+P(A:)+P(A;) 

一 般 地 ,通过 上 面 那 样 进行 合并 及 反复 运用 可 加 性 公理 就 可 推 得 上 述 一 般 结论 。 

例 1.3.2 一 批 产 品 共 100 件 , 其 中 有 5 件 不 合格 品 , 现 从 中 随机 抽出 10 
件 ,其 中 最 多 有 2 件 不 合格 品 的 概率 是 多 少 ? 

解 : 设 A 表示 事件 “抽出 10 件 中 恰 有 ， 件 不 合格 品 ”。 于 是 所 求 事件 A= 
“最 多 有 2 件 不 合格 品 ” 可 表示 为 

A=AJU A, U A, 

FE AA As 为 三 个 互 不 相 容 事件 ,由 定理 1.3.3 知 , 若 能 获得 Ao, A» As 
等 事件 的 概率 ,很 快 能 算得 事件 4 的 概率 ,用 古典 方法 可 算得 诸 A 的 概率 为 


加 


10 
其 中 
f 
107 _ 95} 10! 90] 
| 101 851 1001 
10 / 
_ 90°. 89e. 88.87.86 
= 100 -+ 99-98-97 + 96 + 9837 
类 似 可 算得 
P(A )=0. 3394, P(A) =0. 0702 
于 是 所 求 的 概率 为 


P(A)=P(A0)+P A) +P A,) 
二 0.5837 十 0. 3394 十 0. 0702 
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一 0. 9933 
定理 1.3.4 对 任意 两 个 事件 45 B, Æ ADB, N 
(1)P(A—B)=P(A)—P(B)., 
(DPNO>PSB) 
证 :由 于 ADB, ATE 4 分 为 二 个 互 不 相 容 事件 B 与 4 一 B 之 并 , 即 4 
一 BU (4 一 8)。 由 可 加 性 公理 得 
P(A)=P(B)+P(A—B) 
Hm). AAIE REZ, POCA B)Z0, Aaa. 
EH 1.3.5 对 任 一 事件 4, 有 0 委 P(4) 委 1， 
证 :对 任 一 事件 4 ,总 有 如 下 包含 关系 
$ CACO 
由 定理 1. 3. 4(2) 即 可 得 PO<PIOSP O.) HH PS =0,P(0MD=1 就 可 
获得 上 述 结论 。 
这 个 性 质 告诉 我 们 ,凡是 概率 出 现 1.2,7/5,200% 或 一 0.3 都 说 明 有 错误 
发 生 了 ,必须 检查 和 纠正 。 
定理 1.3.6 对 任意 两 个 事件 4 与 B, 有 
(DP(AUB)=PC(A)+P(B)—PCAB) 
CQIP(AUBD EPA) +P(SB) 
证 :由 于 并 事件 4UB 可 改写 为 二 个 互 不 相 容 事件 4 与 B 一 4B 的 并 ,从 
可 加 性 公理 可 得 
P(AUB)=PC(A)+P(BAB) 
考虑 到 BDAB, HEM 1. 3.400 54% P(B-AB)=P(B)—PCAB) ER 
代 回 原 式 即 得 (1)。 再 因 PAB>O HE O0IBRA. 
上 述 定理 1. 3.6(1) 称 为 概率 的 加 法 公式 , 当 事 件 4 与 B 为 互 不 相 容 事 
件 时 ,P(AB)= 二 0, 它 就 是 可 加 性 公理 , 当 事 件 4 与 B 相 容 时 ,P(AB) 汪 0, 这 
时 加 法 公式 中 最 后 一 项 不 可 少 , 因 为 前 二 项 之 和 P(A4) 十 P(B) 中 PC(4B) 重 复 
计算 了 一 次 ,对 任意 三 个 事件 也 有 类 似 的 加 法 公式 。 
定理 1.3.7 对 任意 三 个 事件 A,B,C, A 
(DPCAUBUC)=PC(A)+PC(B)+P(C) 
| — P(AB)—PCAC)—P(BCI+PCABC) 
(2P(AUBUC<PCA)+P(B)EPLC) 
证 :利用 结合 律 4UBUC=(4UB)UC 和 定理 1. 3.6(1) 可 得 
P(AU BUCOC) 
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=P(AUB)+P(C)—PUAUBIC) 
=P(A)+P(B)—P(AB)+P(C)—P(ACU BC) 
=P(A)+P(B)+P(C)—P(AB)—P(AC)—P(BC)+P(ABC) 
这 就 证 得 (1) ,由 于 BCDABC, ik P(BC)— PCABOI>0, ke ŁO) PRN 
项 将 导致 右 端 有 可 能 被 放大 ,这 说 明 (2)7 亦 成 立 。 
例 1.3.3 搓 两 颗 骨 子 ,至 少 有 一 颗 角 子 的 点 数 大 于 3 的 概率 是 多 少 ? 
解 : 设 A; 为 事件 “第 i 颗 山 子 的 点 数 大 于 3”,z 一 1,2, 那 末 事 件 “ 掷 两 晒 般 
T 20A ME TO RATE 3” 可 表示 为 AUALA 1.3. 1)。 


PMET 
= MM o Aa N + 


1 2 3 4 5 6 
+ BLE 


图 1.3.1 DAS HEEN 


从 图 上 可 看 出 
P(A)—P(As) =}, P(A414:)= 二 


由 定理 1. 3. 6 可 知 ,所 求 概率 为 


_ 1,11 1 3 
一 2 十 7 4 4 


EAE BNVEIFAIAE BT, E DA RAE 3” 
的 概率 ,该 事件 可 表示 为 AU AU 4:。 其 中 As RIA A UB H A 
大 于 3”。 用 古典 方法 容易 算得 | 
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PAAA) => 

于 是 由 定理 1. 3.7 ,可 得 

P(AJU A UA) =PCAY) + PLANE PLA) — PCA) — PAA) 

—P(A,Az3) + P(AA,A;) 

+ 

$ 1.3.4 E PCA)=1/3,P(B)=1/2. 

OEF A S BHE ARA, K PBA); 

(DE ACBKP(BA)D; 

(DÆ PCAB)=1/8,K P(BA), 

E: DE 4 与 B 互 不 相 容 , 则 有 BCA, 从 而 BA=B, K 

P(BA)=P(B)=1/? 
(2) 若 A4CB, 则 有 B 一 A 二 BA, 则 由 定理 1. 3.4 可 得 


P(BA)=P(B—A)—P(B)—P(A) = = 


(3) 在 一 般 场合 ,由 事件 运算 性 质 知 
BA=B—A=B—AB 


1 
6 


由 于 BDAB, HA 
1 1 3 


PBD=PB)-PLAB)= >= => 


811.35 某 人 对 事件 A、B 及 其 并 AUB 分 别 给 出 主观 概率 如 下 ， 
PCA)=1/3, P(B)=1/3, P(AUB)=3/4 
按 概 率 性 质 , 应 有 P(AUB) 志 P(A) 十 P(B)。 然 而 现在 
P(AUB)=3/4, P(A)+P(B)=2/3 
这 个 性 质 不 满足 ,这 个 不 和 谐 之 处 是 由 于 这 组 主观 概率 给 定 不 恰当 而 引起 的 ， 
必须 修正 。 此 人 重新 审定 这 三 个 事件 的 主观 概率 ,发 现 并 事件 4UB 的 主观 概 
率 应 为 3/5。 再 检查 就 没有 此 种 不 和 谐 现象 了 。 


$1.4 4 立 € 


独立 性 是 概率 论 的 一 个 重要 概念 ,我 们 先 讨论 两 个 事件 之 间 的 独立 性 , 然 
后 讨论 多 个 事件 之 间 的 相互 独立 性 ,最 后 再 讨论 两 个 试验 之 间 的 独立 性 。 
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1.41 两 个 事件 的 独立 性 

两 个 事件 之 间 的 独立 性 是 指 一 个 事件 的 发 生 不 影响 另 一 个 事件 的 发 生 ， 
譬如 在 掷 两 是 众 子 的 试验 中 ,我们 考察 如 下 两 个 事件 : 

4 一 “第 一 颗 骨 子 出 现 1 点 ” 
B=“ RT i MA A” 

LAURA UA E BA RA E MI EAN 
ARBOLES AB TT MAS ER A 
点 都 不 会 影响 你 得 奖 的 机 会 ,这 时 就 可 以 说 :事件 4 与 已 独立 。 

从 概率 角度 看 ,两 个 事件 之 间 的 独立 性 与 这 两 个 事件 同时 发 生 的 概率 有 
密切 关系 ,譬如 在 上 面 掷 两 颗 恰 子 的 试验 中 ,事件 4 与 恕 的 概率 分 别 是 已 (4) 
=1/6,P(B)= 王 1/2, 而 这 两 个 事件 同时 发 生 4B 含有 三 个 基本 结果 :(1,2)， 
(1,4),(1,6), 故 PC(4B)==3/36==1/12, 于 是 有 等 式 P(4B)==P(4)P(B)。 这 
不 是 偶然 的 ,而 是 两 独立 事件 的 共同 特征 , 即 两 独立 事件 同时 发 生 的 概率 等 于 
它们 各 自 概率 的 乘积 ,这 就 引出 两 事件 独立 的 一 般 定 义 。 

EX 1.4.1 对 任意 两 个 事件 A 与 B, 着 有 P(A4B)==P(4)P(B), 则 称 
事件 4 与 B 相互 独立 ,简称 4 与 B 独立 。 否则 称 事 件 4 与 B 不 独立 。 

例 1.4.1 (1) 从 一 幅 扑 克 牌 中 任 取 一 张 , “出 现 黑 桃 ”的 事件 4 与 “出 现 
爱 司 ”的 事件 B 是 独立 的 ,因为 它们 的 概率 分 别 是 1/4 s 1/13, 而 它们 同时 出 
现 ( 即 “ 黑 桃 爱 司 出 现 ”) 的 概率 确 是 1/52。 

(2) 考 虑 有 三 个 小 孩 的 家 庭 , 并 设 所 有 八 种 情况 : 

bbb, bbg, bgb, gbb, bgg, gbg, ggb, ggg 
是 等 可 能 的 ， 其 中 2 表示 男孩 ,g 表示 女孩 。 我 们 来 考察 如 下 二 个 事件 : 令 4 是 
“家 中 男女 孩 都 有 ”的 事件 ; 令 B 是 “家 里 至 多 一 个 女孩 ”的 事件 。 它 们 的 概率 
分 别 是 
P(A)=6/8, P(B)=4/8 
而 事件 AB 是 指 “ 家 中 恰 有 一 个 女孩 ”, 其 概率 为 
P(A4B)=3/8=P(A)P(B) 
于 是 ,在 家 庭 中 有 三 个 小 孩 的 情况 下 ,这 两 个 事件 是 独立 的 .但 是 , 当 所 考察 的 
家 性 有 两 个 或 有 四 个 小 孩 时 ,事件 4 与 B 就 不 再 独立 了 ,如 家 中 有 两 个 小 防 
的 情况 ,共有 四 种 等 可 能 结果 :bb,bg,gb,gg。 这 时 
P(A)=2/4, P(B)=3/4, P(AB)=2/4 
由 于 没有 等 式 P(A4B)==P(4)P(B), 所 以 4 与 B 不 独立 ,这 说 明了 两 事件 是 
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否 具 有 独立 性 并 不 总 是 显然 的 。 
两 事件 独立 是 相互 的 , 即 若 事件 A 与 BB 独立, 则 B 与 4 也 独立 。 独立 性 
还 有 如 下 性 质 。 
定理 1.4.1 ARAS BRL UR A 5 BIMA GBA 与 
B A. 
证 :由 事件 的 运算 性 质 知 
AB=A(0—B)=A—AB 
其 中 ADAB, HH 4 与 B 的 独立 性 知 
PCAB)=PC(A)—PCAB) 
=P(A)—P(A)P(B) 
=P(A)LI— P(B) ] 
=P(A)P (B) 
这 表明 4 与 独立 ,类 似 可 证 明 有 4 与 上 独立 ,4 与 B8 独立 。 
例 1.4.2 一 台 戏 有 两 位 主要 演员 甲 与 乙 , 考 察 如 下 两 个 事件 
4 一 “演员 甲 准时 到 达 排 练 场 ” 
B= 二 “演员 乙 准 时 到 达 排 练 场 ” 
并 设 4 与 B 独立 (直观 上 看 ,这 是 一 个 很 合理 的 假设 ,一 位 演员 的 行为 举止 不 
会 被 另 一 位 演员 的 行为 举止 所 影响 ), 假 如 P(A4) 二 0.85,P(B)= 二 0.70, 那 么 
P(A4B) 二 P( 两 位 演员 都 准时 到 场 ) 
=P(A)P(B)=0. 95X0. 70=0. 665 
P(A 号 ) 一 已 ( 两 位 演员 都 未 准时 到 场 ) 
~P(A)P(B)=(1—0.95)(1—0.70)=0. 015 
P( 两 演员 中 仅 有 一 位 准时 到 场 ) 
=P(ABUAB)=P(AB)+P(AB) 
=P(A)P(B)+P(A)P(B) 
=0. 95X0. 3+0. 05X0. 7=0. 32 
在 实际 问题 中 ,判定 两 事件 独立 可 从 定义 1.4.1 出 发 ,但 更 多 的 是 根据 经 
验 事实 去 判定 。 艾 如 ,甲乙 两 门 高 炮 同 时 打 飞 机 ,“ 甲 高 炮 命 中 ”与 <“ 乙 高 炮 命 
中 ?是 两 个 相互 独立 事件 ,因为 经 验 事实 告诉 我 们 , 甲 高 炮 是 否 命中 与 乙 高 炸 
是 否 命 中 是 互 不 影响 的 ， 
顺便 指出 “两 事件 独立 ”与 “两 事件 不 相 容 ” 是 两 个 不 同 的 概念 ,前 者 用 概 
率 等 式 P(4B)=P(C4)P(B5) 判 断 , 后 者 用 事件 等 式 AB= 判断 . 这 两 个 概念 
并 无 什么 联系 ,两 个 独立 事件 可 以 相 容 ,也 可 以 不 相 容 。 可 是 实际 中 遇 到 的 两 
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个 独立 事件 常常 是 相 容 ,如 上 述 两 门 高 炮 打 飞机 ， 甲 高 炮 命 中 ”与 ” 乙 高 炮 命 
中 ”是 独立 事件 ,但 又 是 相 容 事件 。 因 为 它们 可 以 同时 发 生 。 


1. 4.2 多 个 事件 的 独立 性 
首先 研究 三 个 事件 的 相互 独立 性 。 设 4.B.C 是 三 个 事件 ,我 们 说 它们 相 
互 独 江 ,首先 要 求 它们 两 两 独立 , 即 
P(AB)= P(A)P(B) 
P(AC)= P(A)P(C) 
P(BC)=P(B)P(C) 
但 这 还 不 够 ,因为 从 这 三 个 概率 等 式 推 不 出 AB 与 C 独立 .4UB 与 C 独立 。 
假如 再 添加 一 个 概率 等 式 
PLABC)=PA)P(BIP(C) 
就 能 保证 AB 与 C 独立 ,4UB 与 C 独立 。 而 且 还 能 保证 用 4 AMB AZ 
示 的 事件 均 与 C 独立 。 所 以 刻画 4,B,C 三 个 事件 相互 独立 要 用 上 述 四 个 概 
率 等 式 。 由 此 可 以 看 出 ， 对 于 三 个 以 上 事件 的 相互 独立 需要 用 更 多 个 概率 等 式 
去 定义 。 
EX 1.4.2 设 有 nn 个 事件 41,As,…,4,, 假 如 对 所 有 可 能 的 1< ¿<< 
Leen, A FERIRA 
PCA¡A)=PLADPCA)) 
P(AA;A)=P(A)P(A) P(A) 


PCAA A,)— PCA)P(CA,):.. P(A,) 

则 称 此 n 个 事件 41,4,,… A 相互 独立 。 

从 上 述 定 义 可 以 看 出 个 相互 独立 事件 中 任 一 部 分 (一 个 或 几 个 ) 与 另 一 
部 分 (一 个 或 几 个 ) 都 是 独立 的 。 并 且 还 可 证 明 : 将 相互 独立 事件 中 任 一 部 分 换 
为 对 立 事件 ,所 得 的 诸 事件 仍 为 相互 独立 事件 。 

在 实际 问题 中 ,要 判定 诸 事件 的 相互 独立 时 很 少 从 定义 1.4.2 出 发 ,通常 
只 要 根据 经 验 事 实 来 判定 即 可 。 矢 如 多 台 机 床 生产 零件 ,彼此 各 不 相干 , 则 各 
日 是 否 生 产 出 废品 (或 生产 出 多 少 废 品 ) 这 类 事件 是 相互 独立 的 。 独 立 性 概念 
在 概率 论 及 其 应 用 中 都 起 重要 作用 ,本 书 中 大 部 分 结果 都 是 在 独立 性 假设 下 
得 到 的 。 利 用 独立 性 概念 和 事件 的 运算 可 以 计算 一 些 较 复杂 事件 的 概率 。 

例 1.4.3 某 航空 公司 上 午 10 时 左右 从 北京 飞 往 上 海 . 广 州 、. 沈 阳 各 有 
一 个 航班 , 记 A B,C 为 如 下 三 个 事件 ， 
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4 二 =“ 飞 往 上 海 的 航班 满座 ” 
B= 二 “ 飞 往 广 州 的 航班 满座 ” 
C=“ 飞 往 沈阳 的 航班 满座 ” 
假设 这 三 个 事件 相互 独立 , 且 PCA)=0. 9, P(B)=0.8,P(C)=0. 6, HOOK F 
几 个 事件 的 概率 。 
(1) 三 个 航班 都 满座 的 概率 
P(ABC) = P(A)P(B)P(C) 
=0.9X0.8X0.6=0. 432 
(2) 至 少 有 一 个 航班 是 满座 的 概率 
PCAUBUC)=1—P(AUBUC) 
=1— P(A BC) 
=]1— (1—0. 9)(1—0. 8)(1—0. 6) 
=1—0. 008=0. 992 
(3) 仅 有 一 个 航班 是 满座 的 概率 
PCABCUABCUABC) 
=PLABC)+PCABO)+PCABC) 
=0.9X0.2X0.4+0.1X0.8X0.4+0.1X0.2X0. 6 
=0.072+0. 032+ 0. 012=0. 116 
例 1.4.4 一 架 飞 机 有 二 个 发 动机 ,向 该 机 射击 时 , 仪 当 击 中 驾驶 舱 或 同 
时 击 中 二 个 发 动机 时 ,飞机 才 被 击落 。 痢 记 “ 击 中 驾驶 般 ” 的 事件 为 4, 击 中 第 
一 和 第 二 个 发 动机 的 事件 分 别 记 为 Bl 和 B;, 则 “飞机 被 击落 ”这 个 事件 EE 可 
表示 为 
E=AUB,B, 
设 A,B B: 三 事件 相互 独立 , 且 它 们 的 概率 依次 记 为 Pos pi zz 利用 概率 的 
加 法 公式 ,可 得 
P(E)=P(A)+P(BB,)— P(ABB.,) 
再 利用 独立 性 ,立即 可 得 
P(E)= pot pips— popip? | 
511.45 用 品 体 管 装配 某 仪表 要 用 128 个 元 器 件 , 改 用 集成 电路 元 件 
后 ,只 要 用 12 个 就 够 了 ,如 果 每 个 元 器 件 能 用 2000 小 时 以 上 的 概率 是 
0. 996 ,假如 只 有 当 每 一 个 元 怖 件 都 完好 时 ,仪表 才能 正常 工作 , 试 分 别 求 出 上 
面 两 种 场合 下 仪表 能 正常 工作 2000 小 时 的 概率 。 
解 ; 设 事件 A 为 “仪表 正常 工作 2000 小 时 ”， 事件 A 为 “第 ; 个 元 器 件 能 
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工作 到 2000 小 时 ”。 
(1) 使 用 晶体 管 猴 配 仪表 时 ,应 有 A= A Az 4 考虑 到 诸 元 项 件 工作 
状态 的 独立 性 ,可 有 
P(A)= P(A) PCA) = (0. 996)'=0. 599 
(2) 使 用 集成 电路 装配 仪表 时 ,应 有 4 二 A14，…Ais, 考 虑 到 独立 性 ,可 有 
PCA)=PCA1)*""PCA12)=(0. 996)? =0. 953 
EEE LAA ERA A A ,改进 设计 LOCA ARTE AN E LL 
作 的 概率 。 
例 1.4.6 菏 彩 票 每 周 开 奖 一 次 ,每 次 提供 百 万 分 之 一 的 赢 的 机 会 , 若 你 
每 周 买 一 张 彩票 ,尽管 你 坚持 十 年 (每 年 52 周 ) 之 久 , 你 从 未 说 过 的 机 会 是 多 
po 
解 : 按 假设 ,每 次 赢 的 机 会 是 10 ,于 是 每 次 输 的 机 会 是 1 一 10 一 ,另外 ， 
十 年 中 你 共 购 买 彩票 520 次 ,每 次 开奖 都 是 相互 独立 的 , 故 十 年 中 你 从 未 赢 过 
(每 次 都 输 ) 的 机 会 是 
P=(1-—10"%9%=0. 99948 
这 个 很 大 的 概率 表明 十 年 中 你 没 得 一 次 奖 是 很 正常 的 事 。 


1.4.3 试验 的 独立 性 

利用 事件 的 独立 性 可 以 定义 两 个 或 更 多 个 试验 的 独立 性 。 设 有 两 个 试验 
E, 和 i, 假如 试验 E 的 任 一 个 结果 (事件 ) 与 试验 五: 的 任 一 个 结果 (事件 ) 都 
契 相 互 独立 事件 , 则 称 这 两 个 试验 相互 独立 。 璧 如 掷 一 枚 硬币 (试验 E OA 
MRT ORR 五 :) 是 相互 独立 的 ,因为 硬币 出 现 正面 与 反面 与 盘子 出 现 1 至 
6 点 中 任 一 点 都 是 相互 独立 的 事件 ,类 似 可 以 定义 二 个 试验 E, Ez) + En H 
相互 独立 性 ,假如 Ei 的 任 一 结果 、E; 的 任 一 结果 、…、E, 的 任 一 结果 都 是 相 
互 独 立 的 事件 , 则 称 试验 EL Ec) En 相互 独立 ,假如 这 个 试验 还 是 相同 
的 , 则 称 其 为 n E SEE E n MRT RE nA 
等 都 是 n 重 独立 重复 试验 。 


1. 4.4 P 重 贝 努 里 试验 
n 章 贝 努 里 试验 是 一 类 常见 的 随机 模型 ,下 面 我 们 从 贝 努 里 试验 开始 分 
几 点 叙述 这 个 模型 。 
(1) 贝 努 里 试验 只 有 两 个 结果 (成 功 与 失败 ,或 记 为 4 与 4) 的 试验 称 
贝 努 里 试验 . 辟 如 , 抛 一 枚 硬币 (正面 与 反面 )、 检 查 一 个 产品 (合格 与 不 合格 )、 
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一 次 射击 打靶 (命中 与 不 命中 ) 、 诞 生 一 个 婴儿 ( 男 与 女 ) ,检查 一 个 男人 的 眼睛 
( 色 言 与 不 色盲 ) 等 都 可 看 作 一 次 贝 努 里 试验 ,再 也 没有 比 贝 努 里 试验 更 简单 
的 随机 试验 了 ,最 简单 的 常 肖 是 用 得 最 频 党 的 。 

(2) 在 一 次 贝 努 里 试验 中 , 设 成 功 的 概率 为 p, 即 

P(A)=p, PCA)=1-p 
其 中 0 二 p 过 1 ,不同 的 p 可 用 来 描述 不 同 的 贝 努 里 试验 , 辟 如 在 检查 一 个 产品 
中 ,有 / 
P( 合 格 品 )= 二 0.9， PP( 不 合格 品 )=0. 1 

假如 我 们 的 兴趣 在 研究 不 合格 品 上 , 那 可 假设 p=0.1, 而 把 不 合格 品 的 出 现 
看 作 “ 成 功 ”, 当 然 , 也 可 假设 p= 二 0.9, 这 时 我 们 的 注意 力 将 转 到 合格 品 的 出 现 
上 ,把 合格 品 的 出 现 看 作 “ 成 功 ”, 这 两 种 设 定 都 是 可 以 的 ,但 一 定 要 明确 , “成 
功 ” 的 含义 是 什么 ? 

(3)n ENFER 由 = 个 (次 ?相同 的 .独立 的 贝 努 里 试验 组 成 的 随机 
试验 称 为 n 重 贝 努 里 试验 。 壁 如 , 抛 3 枚 硬币 (或 一 硬币 抛 3 次 )、 检 查 7 个 产 
mt] 10 KE EE 100 个 而 儿 等 都 是 多 重 贝 努 里 试验 。 

n 重 贝 努 里 试验 的 基本 结果 可 用 长 为 an 的 4 与 和 妃 的 序列 表示 , 辟 如 在 5 
重 贝 努 里 试验 中 的 几 个 基本 结果 ， 

AAAAA 表示 前 二 次 成 功 , 后 三 次 失败 。 
44444 表示 第 一 和 第 五 次 成 功 ,其 余 三 次 失败 。 


根据 独立 性 可 以 算得 上 述 几 个 基本 结果 发 生 的 概率 : 
PC(AAAAA)=PC(AAAJAA)=p*(1— p)? 
En 前 贝 努 里 试验 中 ,人 们 最 关心 的 是 成 功 次 数 ( 或 4 的 个 数 )。 因 为 成 
功 次 数 是 基本 结果 中 所 含 的 最 重要 信息 ,而 4 与 4 的 排列 次 序 在 实际 中 往往 
是 不 感 兴趣 的 信息 。 若 记 
Bt 二 “n 重 贝 努 里 试验 中 A 出 现 上 次 ” 
M, B RRR n 重 贝 努 里 试验 中 4 出 现 0 次 ”, 言 下 之 意 ,有 出 现 n 次 ， 
即 Bo 一 {4A4… 有 4}, 它 的 概率 为 
P(Ba.0)=(1—p)” 
又 如 ,B,,, 表 示 事 件 “n 重 贝 努 里 试验 中 4 出 现 1 次 ”, 即 
B=“AA:…A,AAA.…A,:…,AA.…AA” 
其 中 共有 个 基本 结果 ,每 个 基本 结果 的 概率 为 pp Y i 
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PB. O) =2np(1p "7 
一 般 地 ,事件 B,,: 中 的 基本 结 采 是 由 个 A 和 一 个 A 组 成 的 序列 ,由 于 它 
们 位 置 上 的 差别 ,此 种 基本 结果 共有 | ,| 个 ,每 个 发 生 的 概率 省 为 p* (1 一 
p)” ,所 以 


n 
k 
PB) = [pap (1. 4.2) 


其 中 上 可取 0,1,…,n, 这 就 是 “n 重 贝 努 里 试验 中 成 功 & 次 ?的 概率 的 一 般 计 
算 公 式 ,在 实际 中 很 常用 。 
例 1.4.7 一 位 射手 打靶 ,命中 率 为 0.9,6 次 打靶 就 是 6 重 贝 努 里 试验 ， 
E Bi 二 “6 次 打靶 中 命中 次 ”, 显 然 ,k 可 以 为 0,1,2,3,4,5,6 等 7 个 值 ,由 
(1. 4. 2) 式 可 算得 
P(B: ) =P C6 次 打靶 ,都 没命 中 ) 二 0. 1 =0. 0000 
P(Bi) 一 P(6 次 打靶, 仅 命中 1 Y) =65X0.9X0. 1*=0. 0001 


P(Bo2)=PC6 KIH, mP 2 次 )=| | X0. 9% X0.1 一 0.0012 
P(B) =] >] 0. 9X0. 1=0. 0146 

PBs) =| | X0. 9x0. 1?=0. 0984 

PB.) =| y x0. 97X0. 1=0. 3543 


peñas =$) xo. oro. 5314 
由 上 述 7 个 概率 可 计算 很 多 事件 的 概率 , 辟 如 
P(6 次 打靶 ,至 少 命中 4 次 )=P(B6,s) 十 PC(B6,s) 十 P(Bs,e) 
一 0. 0984 十 0. 3543 十 0. 5314=0. 9841 
P6 次 打 邯 ,最 多 命中 2 次 )= 二 P(Bo66o) 十 PC(B6,) 二 PC(B,,;) 
一 0. 0000 十 0. 0001 十 0. 0012=0. 0013 
可 见 该 射手 在 6 次 打靶 中 命中 4 次 以 上 的 把 握 很 大 ,假如 换 一 位 射手 ,他 命中 
概率 为 0.6, 在 6 次 打 轩 中 他 至 少 命中 4 次 的 把 握 就 没有 这 么 高 ,而 为 
P (Bs, U Be,s Bs,e) 


6 
-| i x0. 6X0. 4 十 | | X0. 6x0. 4+| >] X 0. 6 
一 0. 3110 十 0. 1866 十 0. 0467=0. 5443 
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$1.5 条 件 概 奉 


条 件 概 率 是 概率 论 中 的 一 个 基本 概念 ,也 是 概率 论 中 的 一 个 重要 工具 ,化 
既 可 以 帮助 我 们 认识 更 复杂 的 随机 事件 ,也 可 帮助 我 们 计算 一 些 复杂 事件 的 


1.5.1 HB 

条 件 概 率 要 涉及 两 个 事件 4 与 B, 在 事件 B 已 发 生 的 条 件 下 ,事件 A 再 发 
生 的 概率 称 为 条 件 概率 , 记 为 PC418B), 它 与 前 面 讲 的 事件 4 的 (无 条 件 ) 概 率 
P(4) 是 两 个 不 同 的 概念 ,为 了 说 清楚 条 件 概率 概念 ,我 们 先 来 考察 一 个 例子 。 

例 1.5.1 MRAZ AMO MAREA 25 个 温泉 浴场 供应 矿泉 水 ,每 
个 浴场 要 安装 一 个 阀门 ,这 25 个 阁 门 购 自 两 家 生产 厂 ,其 中 部 分 还 是 有 缺陷 
的 ,具体 见 如 下 二 维 联 列表 : 


B: 无 缺陷 BARK 


为 作 试验 ,随机 地 从 25 个 阀门 选 出 一 个 ,考察 如 下 两 个 事件 : 
4 一 “ 选 出 的 阀门 来 自生 产 厂 1” 
| 8 一 “ 选 出 的 准 门 是 有 缺陷 的 ” 
利用 二 维 联 列表 提供 的 信息 ,容易 算得 事件 A、B 及 4B 的 概率 : 


_1 I a — -2 
PA)=5r> P(B) =3r> 4 一 75 


其 中 AB 表示 事件 “ 选 出 的 国门 是 来 自生 产 厂 1, 并 有 缺陷 ”。 

现 我 们 转 而 考察 如 下 问题 : 当 已 知事 件 B 发 生 的 条 件 下 ,事件 4 再 发 生 . 

的 概率 是 多 少 ? 事件 B 的 发 生 给 人 们 带 来 新 的 信息 :B 的 对 立 事件 万 一 “ 选 出 

的 阀门 是 无 锯 陷 的 ”是 不 能 发 生 了 ,因此 B 中 的 18 个 基本 结果 立即 从 考察 中 

剔 去 ,所 有 可 能 发 生 的 基本 结果 仅 限 于 妃 中 的 7 个 基本 结果 ( 见 图 1. 5. 1), 这 

意味 者 ,事件 B 的 发 生 改变 了 基本 空间 ,从 原 基 本 空间 Q( 含 有 25 个 基本 结 
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果 ) 缩 减 为 新 的 基本 空间 BEAT? 个 基本 结果 ), 这 时 事件 4 所 含 的 基 
本 结果 在 Q 中 所 占 的 比率 为 5/7, 这 就 是 在 事件 B 已 发 生 下 ,事件 4 的 条 件 
概率 , 即 PCAIB)=5/7, 


1.5.1 例 1.5. 1 的 维 思 图 (每 个 点 表示 一 个 阀门 ) 


我 们 继续 考察 这 个 例子 ,条 件 概率 PCA1B) 二 5/7 中 的 分 母 是 事件 B 中 
的 基本 结果 数 , 记 为 N(B) 二 7。 分 子 是 交 事件 AB 中 的 基本 结果 数 , 记 为 N 
(4B) 一 5, 若 分 子 与 分 母 都 同时 除 以 原 基 本 空间 Q 中 的 基本 结果 数 N CO), MU 


有 如 下 关系 式 


= NBE) ™ NGC)JANCO) ™ PSB) (1.5. 1) 


这 表明 :条 件 概 率 可 用 两 个 特定 的 无 条 件 概 率 之 商 表示 。 式 (1. 5. 1) 不 仅 在 等 
可 能 场合 成 立 , 在 一 般 场 合 也 是 合理 的 ,以 致 于 把 (1. 5. 1) 式 公认 为 条 件 概 率 
的 定义 ,但 要 保证 (1. 5. 1) 式 中 的 分 母 不 为 零 ,这 样 我 们 就 得 到 条 件 概 率 的 一 
般 定 义 。 

定义 1.5.1 设 4 与 已 是 基本 空间 @ 中 的 两 个 事件 , 且 P(B)>0, 在 事 
件 8 已 发 生 的 条 件 下 ,事件 4 的 条 件 概率 P(418) 定 义 为 P(4B)V/P(B), 即 
P(AB) 
P(B) 
其 中 P(418) 也 称 为 给 定 事件 B 下 事件 4 的 条 件 概率 。 

例 1. 5.2 某 市 的 一 项 调查 表明 ,该 市 有 30% 的 学 生 视 力 有 缺陷 。7% 的 
学 生 昕 力 有 缺陷 ,3% 的 学 生 视 力 与 听力 都 有 缺陷 , 记 

五 一“ 学 生 视 力 有 缺陷 >， P(E) 二 0. 30 


PCA|B)= 
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五 = 王 “学生 听 力 有 缺陷 ”， PUD=0. 07 
开刀 一 “学 生 视 力 与 听力 都 有 缺陷 ”， P(EH)==0.03 
现 来 研究 下 面 三 个 问题 : 
DIRE 5 H ÆR? 由 于 
P(EDPUD=0.30X0.07=0.0214P(EH) 
所 以 事件 五 与 H 不 独立 , 即 该 市 学 生 中 视力 缺陷 与 听力 缺 隐 有 关联 ， 
《2) 如 果 已 知 一 学 生 视力 有 缺陷 ,那么 他 听力 也 有 缺陷 的 概率 是 多 少 ? 这 
要 求 计 算 条 件 概率 P(EHIE), 由 定义 1.5.1 知 


(3) 如 采 已 知 一 学 生 听 力 有 缺陷 ,那么 他 视力 也 有 缺陷 的 概率 是 多 少 ? 类 
似 地 可 算得 


811.53 表 1.5.1 给 出 马 包 的 寿命 表 。 寻求 下 面 一 些 事件 的 条 件 概率 ， 
表 1.5.1 乌龟 的 寿命 表 


ERG) 存活 概率 | FRG) 存活 概率 
0 1. 00 140 0.70 
20 0. 92 160 0. 61 
40 0. 90 180 0. 51 
60 0. 89 200 0. 39 
80 0. 87 220 0. 08 
100 0. 83 | 240 0. 004 
120 0. 78 260 0. 0003 


(1) 活 到 60 +48, 47% 40 年 的 概率 是 多 少 ? 
记 As 表示 “ 乌 包 活 到 r 岁 ” 这 样 的 事件 ,要 求 的 概率 是 条 件 概率 P CA 100 | 
Aco) , 按 条 件 概率 定义 ， 
PC4e4io) 
P (Aso) 
由 于 活 到 100 岁 的 乌龟 一 定 活 到 60 岁 , 所 以 4ioC4io, 于 是 Aso Ar00 = 
Ax00> MA MI 


P (Aioo | Aso) — 


EH 100 只 活 到 60 岁 的 乌 包 大 约 有 93 只 能 活 到 100 5, 
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(2)120 岁 的 乌龟 能 活 到 200 岁 的 概率 是 多 少 ? 
用 前 面 的 记号 可 得 ， 


P(A)  PCAmo) 0.78 
即 活 到 120 岁 的 乌龟 中 大 约 有 -- 半 能 活 到 200%, 
(3320 岁 的 乌龟 能 活 到 90 岁 的 概率 是 多 少 ? 
类 似 可 得 


_ PCAy)_0. 83 _ 
P CAs | A2) = PAN) 0.92 0. 92 


其 中 已 (4s) 一 0. 85 是 运用 线性 内 插 法 获得 的 。 


(4)20 岁 的 乌龟 活 到 z 岁 的 概率 是 1/2, 试 问 z 是 多 少 ? 
PA.) 1 


P(As) 2 


P(A | Azo) — 


P(A-)=5 XP(An)=0. 46 


从 表 1. 5. 1 可 以 看 到 答 数 应 在 180 岁 到 200 岁 之 间 ， 利 用 线性 内 插 法 可 算得 
1=188 4. BN 20 岁 的 乌龟 中 大 约 有 一 半 能 活 到 188 Y, 


1.5.2 条 件 概率 的 性 质 
自 先 指出 ,条件 概 率 是 概率 , 即 由 定义 1. 5. 1 给 出 的 条 件 概 率 满足 概率 的 
三 条 公理 : 
(DIEMYE:PCAIB)>0 
(DIE WPE.PCQ|B)=1 
(3) 可 加 性 :假如 事件 A, 与 As E AMA, H PC(B) 二 0, 则 
其 中 非 负 性 与 正则 性 是 显然 的 ,下 面 我 们 来 证 明 可 加 性 ,由 条 件 概 率 定 义 知 
PAULA o A = 
由 于 As 与 4, 互 不 相 容 , 故 41B 与 4;B 也 互 不 相 容 ， 四 概率 的 可 加 性 公理 可 
推出 条 件 概率 的 可 加 性 , 即 
PUA B) = LORD L PCA, |B)+PCAB) 
由 此 可 知 ,条 件 概 率 也 具有 三 条 公理 导出 的 一 切 性 质 。 如 
P($|B)=0 
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PCA|B)=1—PCA|B) 
PCA,U 4,1B>=P(A¡|B)+P(4A2|B>-P(A4,/4:1B)> 
特别 , 当 B= 时 ,条 件 概率 转化 为 无 条 件 概率 ,因此 把 无 条 件 概 率 看 作 特 殊 
场合 下 的 条 件 概率 也 未 尝 不 可 。 
除 此 以 外 ,条 件 概 率 还 有 一 些 特殊 性 质 , 这 些 性 质 将 可 帮助 我 们 计算 一 些 
复杂 事件 的 概率 。 
定理 1. 5. IGERARO 对 任意 两 个 事件 4 与 8, 有 
P(AB)=P(A|B)P(B)=P(B|A)P(A) 
其 中 第 一 个 等 式 成 立 要 求 P(B)>0, 第 二 个 等 式 成 立 要 求 P(A4A)>>0。 
利用 条 件 概 率 定 义 立 即 可 得 上 式 , 它 表明 任意 两 个 事件 的 交 的 概率 等 于 
一 事件 的 概率 乘 以 在 这 事件 已 发 生 条 件 下 另 一 事件 的 条 件 概 率 , 只 要 它们 的 
概率 都 不 为 零 即 可 。 
定理 1.5.2 假如 事件 4 与 已 独立 , 且 P(B)>0, 则 P(4|B8)= 一 P(4), 反 
之 亦 然 。 
利用 两 事件 的 独立 性 定义 立即 可 得 上 式 。 这 个 性 质 表 明 , 若 两 事件 独立 ， 
则 其 条 件 概 率 就 等 于 其 概率 ,这 里 事件 B 的 发 生 对 事件 4 是 否 发 生 没 有 任何 
影响 ,反之 , 石 有 P(41B3)=P(4), 则 由 乘法 公式 立即 可 得 出 PCB) PCA) 
P(B), 故 4 与 B 独立, 故 亦 可 用 P(A1B) 二 P(A) 来 定义 事件 4 与 B 的 独立 
性 ,我 们 之 所 以 采用 PC(4B)= 二 P(A4)PCB) 来 定义 事件 4 与 B 独立 ,是 因为 这 
样 的 定义 可 以 解除 P(B)>0 的 约束 ， 
定理 1.5. 3( 一 般 乘 法 公式 ) 对 任意 三 个 事件 An Az 和 As A 
P(A¡A¿A3)=PCADP (A: | ANP (As 14142) 
其 中 PCALADO>O, 
证 :由 于 P(A414;) 守 0, 由 乘法 公式 可 得 
P(A,4:43)= P(A, A:)P A;|A1A,) 
由 于 4; 二 4;4:, 故 由 定理 1.3.4 知 POA)>PC(A/A2)>0, HH — It PAA) 
使 用 乘法 公式 即 得 此 定理 。 
定理 1. 5.3 可 以 推广 到 四 个 或 更 多 个 事件 的 交 上 去 ， 
例 1.5.4 在 例 1.5.2 的 调查 数据 下 我 们 曾 研 究 过 三 个 问题 ， 现在 我 们 
继续 研究 另外 几 个 问题 。 
(4) 随 意 找 一 个 学 生 ,他 视力 没 缺 陷 但 听力 有 缺陷 的 概率 是 多 少 ? 这 要 求 
计算 交 事 件 EH 的 概率 ,由 乘法 公式 知 
P(ED)=P(E|HDP(H) 
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=[1—P(E|D ]P (H) 
=[1 一 了 >]X0 07=0. 04 


(5) 随 意 找 一 个 学 生 MEL ARABIA AMARRES? 类 似 
地 可 算得 
P(EH)=P(H|E)P(E) 
=(1—0. 1) X0. 3=0. 27 
(6) 随 意 找 一 个 学 生 ,他 的 视力 和 听力 都 无 缺陷 的 概率 是 多 少 ? 这 要 求 计 
算 交 事件 EF 的 概率 ,利用 对 偶 原 理 ( 见 习题 1. 1. 10) 知 EH =EUF KA 
PED)=P(EUHD)=1-P(EUH) 
=1—[P(E)+P(H)—P (EH) ] 
=1—(0. 30+0.07—0. 03) =0. 66 
把 上 述 计 算 结 果 整 理 成 如 下 二 维 列 联 表 , 它 可 检查 计算 是 否 有 误 。 


例 1.5.5 铅 子 模型 。 设 铅 中 有 5 个 黑 球 和 7 个 红 球 ,每 次 随机 取出 一 个 
球 , 把 原 球 放 回 ,还 加 进 (与 取出 的 球 ) 同 色 球 c 个 和 蜡 色 球 d 个 ,这 里 c 与 a 
RECHE., E B 表示 “第 i 次 取出 是 黑 球 ”这 样 一 个 事件 ,R,; 表示 “第 ; 次 
取出 是 红 球 ”这 样 一 个 事件 ,我 们 来 研究 下 列 事件 的 概率 ， 
P(BIR.R;)=P(B)PR, |B))PCR; | BR,) 
S r+d ，_ 7 十 QZ 十 c 
= b+r b+r+c+d b+r+2+2d 
PCR B:R3)=PC(R)P (B: |RI)P (CR; | RIB,) 
ar .— btd  _rtctad 
b+r b+r+c+d b+r+2c+2d 
PRIR¿B3)=P(ROIPUR¿IROPUB |R| Ro) 
_ rr e ,b+2d 
b+r b+r+c+d b+r+2c+2d 
这 三 个 概率 是 不 同 的 ,这 表明 黑 球 出 现 的 次 序 在 影响 着 概率 ， 
直面 我 们 来 研究 几 种 特殊 情况 . 
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(co,Z=0. 这 意味 着 :每 次 取出 球 后 会 增加 下 一 次 也 取 到 同色 球 的 概 
率 , 这 是 一 个 传染 病 模型 。 每 次 发 现 一 个 传染 病 患 者 ,以 后 都 会 增加 再 传染 的 
概率 。 在 这 种 情况 下 ,上 述 三 个 概率 分 别 为 


2 r , rc 
PORR) =y b+r+c b+r+2c 


__r .—Ż_ . rc 
PRBRO=S Er strie ”天 7 十 中 


DZ, re > 
PRIRIB)= Ty b+r+c bAHr+2c 


这 二 个 概率 相同 ,这 表明 ,在 4=0 场合 ,上 述 概 率 只 与 黑 球 红 球 出 现 的 次 数 
有 关 , 而 与 出 现 的 顺序 无 关 。 这 一 现象 在 取 更 多 个 球 时 也 是 这 样 。 

(2)c 一 0,d>>0。 这 是 一 个 安全 模型 。 每 当 发 生 了 事故 (如 红 球 被 取出 ), 安 
全 工作 就 抓 么 一 些 , 下 次 再 发 生 事故 的 概率 就 会 减少 ?而 当 没 有 事故 发 生 时 ， 
安全 工作 吏 会 放松 一 些 ,于 是 发 生 事故 的 概率 就 增 大 。 在 这 种 场合 下 ,上 述 三 
个 概率 分 别 为 


b , r+d i r+d 
bi+r b+r+d b+r+2d 


r b+d r+d 
PRIBRI= Ty . EENE ° AEEY 
r r b+2d 
PRRBO= E" BH Ta B+r+ oe 
这 三 个 概率 不 相同 .这 表明 :在 c=0 场合 ,上 述 概 率 不 仪 与 黑 球 与 红 球 出 现 的 
次 数 有 关 , 还 与 出 现 的 顺序 有 关 。 | 
(3)c 二 0,d 二 0, 这 是 放 回 抽样 ,前 次 抽取 结果 不 会 影响 后 次 抽取 结果 , 故 
土 述 三 个 概率 相等 ,并 都 等 于 br?/ btr. 
(4)c 二 一 1,d 二 0。 这 是 无 放 回 抽样 ,每 次 抽出 的 球 不 再 放 回 镀 中 ,这 时 前 
次 抽取 结果 会 影 啊 后 次 抽取 结果 ,但 只 要 抽取 的 黑 球 与 红 球 的 个 数 相同 ,其 概 
率 是 不 依赖 其 抽出 球 的 顺序 ,它们 的 概率 相同 ,并 且 都 为 入 Cr 一 1)/( 十 r)(8 
十 > 一 1)(8 十 ~ 一 2) 。 


P(B RR) == 


1.5.3 全 概率 公式 
全 概率 公式 是 概率 论 中 的 一 个 基本 公式 。 它 使 一 个 复杂 事件 的 概率 计算 问 
ARI ,得 以 解决 。 下 面 来 叙述 获得 全 概率 公式 的 简单 形式 和 一 般 形式 。 
定理 1.5.4 设 A 与 B 是 任意 二 个 事件 ,假如 0 二 P(B) 二 1, 则 
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PCA)=P(A|B)P(B)+P(A|B)P(B) 
证 :由 BUB=0 和 事件 运算 性 质 知 
A=A0=A(BUB)=ABUAB 
显然 AB 与 4 万 是 互 不 相 容 事件 ,由 加 法 公式 和 乘法 公式 知 
P(A)=P(AB)+P(AB) 
=P(A|B)P(IB)I + PCALBIP(B) 

EFPDRAO 与 1, 所 以 已 (五 ) 六 0, 从 而 上 述 两 个 条 件 概 率 已 (4 BD 
P(A1B) 部 是 有 意义 的 。 

例 1.5.6 RE n 张 彩票 中 有 一 张 奖券 。 求 第 二 人 摸 到 奖券 的 概率 是 多 
少 ? 

解 : 设 4; 表示 “第 i 人 措 到 奖券 ”这 样 一 个 事件 。 如今 要 求 PA» ,直接 计 
A PCAs) 相 当 困 难 , 但 大 家 知道 ,A; 的 发 生 与 A 是 否 发 生 关系 很 大 , 若 Ai 已 
发 生 , 则 A, 再 发 生 的 条 件 概率 P(As|41) 二 0。 车 A REGIA 发 生 ), 则 


As 再 发 生 的 条 件 概率 PA) =. 而 A 5A 是 基本 空间 中 两 个 概率 
大 于 0 的 事件 , 且 P(A41)== 二 ,P(A1) 一 一。 于 是 由 全 概率 公式 知 ， 


n 


P(A) =P(A PCA: | A) PCADPCA Ar) 


=4.q441,-1_1 


n n n—1 n 
用 类 似 方法 亦 可 算得 第 三 人 、 第 四 人 、…, 措 到 奖券 的 概率 仍 为 二 。 这 说 明 , 摸 


彩 不 论 先后 ,中 奖 的 机 会 是 均等 的 。 类 似 的 ,在 体育 比赛 中 抽签 不 论 先 后 ,机 会 
也 是 均等 的 ， 

例 1. 5.7( 敏 感性 问题 的 调查 ) 学 生 阅读 黄色 书刊 和 看 黄色 影像 会 严重 
影响 学 生 身 心 健康 发 展 ,但 这 些 都 是 避 着 教师 与 家 长 进行 的 , 属 个 人 隐私 行 
为 ,要 调查 观看 黄色 书刊 或 影像 的 学 生 在 全 体 学 生 中 所 占 比 率 p 是 一 件 难 
事 ,这 里 的 关键 是 要 设计 一 个 调查 方案 ,使 被 调查 者 愿意 作出 真实 回答 又 能 保 
守 个 人 秘密 ,经 过 多 年 研究 与 实践 ,一 些 心理 学 家 和 统计 学 家 设计 了 一 种 调查 
方案 ,这 个 方案 的 核心 是 如 下 两 个 问题 ， 

问题 4: 你 的 生日 是 否 在 7 月 1 日 之 前 ? 
问题 B: 你 是 否 看 过 黄色 书刊 或 影像 ? 
被 调查 者 只 需 回 答 其 中 一 个 问题 ,至 于 回答 哪 一 个 问题 由 被 调查 者 事先 从 一 
个 钠 中 随机 抽 一 只 球 ,看 过 颜色 后 再 放 回 , 若 抽 出 白 球 则 回答 问题 4; 若 抽出 
红 球 则 回答 问题 B, 钠 中 只 有 白 球 与 红 球 ,上 且 红 球 的 比率 x 是 已 知 的 , 即 
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PCER) =x, PAR) )=1—r. 
被 调查 者 无 论 回答 问题 4 或 问题 有 ,只 需 在 下 面 答卷 上 认可 的 方 杠 内 打 勾 ， 
然后 把 答卷 放 入 一 只 密封 的 投票 箱 内 。 


上 述 抽 球 与 答卷 都 在 一 间 无 人 的 房间 内 进行 ,任何 外 人 都 不 知道 被 调查 者 抽 
到 什么 颜色 的 球 和 在 什么 地 方 打 勾 ,如 果 向 被 调查 者 讲 清 这 个 方案 的 做 法 ,并 
严格 执行 , 那 末 就 容易 使 被 调查 者 确信 他 (她 ) 参 加 这 次 调查 不 会 泄露 个 人 秘 
密 , 从 而 愿意 参加 调查 。 

HAREA S m 1000 人 以 上 ) 参 加 调查 后 ,就 可 打开 投票 箱 进行 统 
it. RA 张 答卷 ,其 中 & 张 答 “是 ”, 于 是 回答 “是 ”的 比率 是 p, 可 用 频率 9 一 
k/n 去 估计 , 记 为 

PGÉ)=k/n 
这 里 答 “ 是 ”有 两 种 情况 :一 种 是 摸 到 白 球 后 对 问题 4 答 “ 是 ”, 这 是 一 个 条 件 
概率 , 它 是 “生日 在 7 月 1 日 前 ”的 概率 ,一 般 认为 是 0.5, 即 
P( 是 | 日 球 ) 二 0.5 
男 一 种 是 措 到 红 球 后 对 问题 B 答 “ 是 ”, 这 也 是 一 个 条 件 概 率 , 它 不 是 别 的 ,就 
是 看 黄色 书刊 或 影像 的 学 生 在 全 体 学 生 中 的 比率 p, 即 
P( 是 | 红 球 )=p : 
最 后 利用 全 概率 公式 把 上 述 各 项 概率 (或 其 估计 值 ) 联 系 起 来 
P (是 )==P( 是 | 日 球 )P(《 日 球 ) 十 P( 是 | 红 球 )P( 红 球 ) 
g=0.5(1—r)+p 07 
由 此 可 获得 感 兴趣 的 比率 p 
65 一 [9 一 0.5(1 一 r)]/r 

假如 在 这 项 调查 中 铅 中 有 50 个 球 , 其 中 红 球 30 个 , 即 x=0.6, 另 外 学 校 
在 五 天 内 安排 31 个 班 的 学 生 共 1583 名 参加 调查 ,最 后 开 箱 统计 ,全 部 有 效 ， 
其 中 回答 “是 ”的 有 389 张 , 据 此 可 算得 


_ [389 1 加 
= [2 7 x0. 4/0. 6=0. 0762 
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这 表明 全 校 约 有 7. 62% 的 学 生 看 过 黄色 书刊 或 黄色 影像 。 

像 这 类 敏感 性 问题 的 调查 是 社会 调查 中 的 一 类 ,如 一 群 人 中 参加 赌博 的 
比率 、 吸毒 人 的 比率 .个 体 经 营 者 的 偷税 潮 税 户 的 比率 .学 生 中 考试 的 作弊 率 
等 都 可 参照 此 方法 组 织 调查 ,获得 感 兴趣 的 比率 。 

现在 我 们 转 入 讨论 全 概率 公式 的 一 般 形式 ,为 此 需要 一 个 “分 割 ”" 的 概念 。 

定义 1.5.2 把 基本 空间 分 为 n 个 事件 B1,B;,…,B.( 见 图 1.5.2) ,假如 

(1)P(CB)>0,i=1,2,* ,nn 

(2)Bi, B23", B, 互 不 相 容 


(UB=Q 
则 称 事 件 组 B, , B2, … 为 基本 空间 Q 的 一 个 分 割 。 


1.5.2 8 的 一 个 分 割 
其 中 阴影 部 分 为 事件 4。 


假如 事件 B 的 概率 PC(B) 满 足 0 二 PC(B) 二 1, 则 B 与 就 是 相应 基本 空 
El 0 的 一 个 最 简单 的 分 割 。 

EX 1.5.5 设 Bi,B;,…,B 是 基本 空间 Q 的 一 个 分 割 , 则 对 0 中 任 一 
事件 4, 有 


P(A)= 2PCA IBI)PB) 
证 :由 事件 运算 知 ( 见 图 1. 5. 2) 
A=A0=A(UB)= UAB. 


由 B1, Bot B, 互 不 相 容 可 导出 AB, , AB, >>> AB, 亦 互 不 相 容 ,再 由 可 加 性 
和 乘法 公式 可 得 


P(A)= 2 P(AB)= 24 P(A]B)P(B;) 
这 个 性 质 的 运用 关键 在 于 寻找 一 个 合适 的 分 割 ,使 诸 概率 PCB) Z 
件 概 率 P(A41B,) 容 易 求 得 。 
例 1. 5.8 一 批 产 品 来 自 三 个 工厂 ,要 求 这 批 产品 的 合格 率 。 为 此 对 这 三 
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个 工厂 的 产品 进行 调 奉 , 发 现 甲 三 产品 合格 率 为 95%%, 乙 厂 产品 合格 率 为 
80% ,两 三 产品 合 格 率 为 65%。 这 批 产 品 中 有 60% 来 目 平 让 ,30% 来 自己 |， 
余下 10% 来 自 丙 厂 。 
AURE A4=“ 产 品 合 格 ”,B1 二 “产品 来 自 甲 厂 ”, B, 二 “产品 来 自己 厂 ”， 
B;= 二 “产品 来 目 肉 厂 ”。 由 上 述 调 查 可 知 
P(A|B¡)=0.95, PC(A|B,)=0.80, PCAI|B¿)=0. 65 
P(51)=0.60, P(B,)=0.30, P(B,)=0.10 
最 后 由 全 概率 公式 知 
PCA)=PCA |BI)P(BI)A+PCALBOPBI+FPCA|BIP(BS) 
一 0. 95X0. 60+0. 80X0. 30+—0. 65X0.10 
=0. 875 
这 批 产品 的 合格 率 为 0. 875。 


1. 5.4” 贝 叶 斯 公式 

在 全 概率 公式 的 基础 上 立即 可 推 得 一 个 很 著名 的 公式 。 

定理 1.5. 6( 贝 叶 斯 公式 ) RHF BB ,B:，…,B, 是 基本 空间 Q 的 一 个 分 
割 , 且 它 们 各 上 自 概 率 PC(B1) ,PC(B,),…,P(B,) 皆 已 知 且 为 正 ,又 设 A 是 0 中 的 
一 个 事件 ,P(4)>0, 且 在 诸 B: 给 定 下 事件 4 的 条 件 概 率 P(A4|B1) ,P(A418B,)， 
… ,P(A|B,) 可 通过 试验 等 手段 获得 , 则 在 4 给 定 下 ,事件 Bi 的 条 件 概 率 为 


P 
PB a) = BoP) k=l,2,* „n 


2 ,P(AIB)PB,) 
证 ; 因 诸 PC(B;)>0 和 P(A)>>0, 由 乘法 公式 知 
PBAA PLA) =PCAIBIP(B) 
其 中 已 (4) 用 全 概率 公式 代入 即 得 上 述 贝 叶 斯 公式 。 
仔细 分 析 ,在 贝 叶 斯 公式 里 涉及 到 三 组 概率 ,已 知 两 组 概率 {P(CB))} 和 { 忆 
(418B;)}), 可 求 出 第 三 组 概率 {P(B;|4)}。 下面 结合 例子 来 说 明 这 三 组 概率 的 
含义 和 贝 叶 斯 公式 的 作用 。 
例 1.5.9 为 了 提高 某 产品 的 质量 ,公司 经 理 考 虑 增加 投资 来 改进 生产 
设备 ,预计 和 需 投 资 90 万 元 。 但 从 投资 效果 看 ,下 属 部 门 有 两 种 意见 ， 
Bi :改进 生产 设备 后 ,高 质量 产品 可 占 90% 
瑟 : :改进 生产 设备 后 ， 高 质量 产品 可 占 70% 
经 理 当 然 希 望 B 发 生 , 公 ` 司 的 效益 可 得 到 很 大 提高 。 但 是 根据 下 属 两 个 
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部 门 过 去 建议 被 采纳 的 情况 ,经 理 认 为 B 的 可 信 程 度 只 有 40% ,B; 的 可 信 程 
度 是 60% El 
P(B)=0.4, P(B,)=0.6 

这 两 个 都 是 经 理 的 主观 概率 ,经理 不 想 仅 用 过 去 的 经 验 来 决策 此 事 , 想 慎重 一 
些 。 通 过 小 规模 试验 后 , 观 其 结果 再 定 。 为 此 做 了 一 项 试验 ,试验 结果 ( 记 为 
AWF: 

4: 试 制 了 五 个 产品 ,全 是 高 质量 产品 。 

经 理 对 此 试验 结果 很 高 兴 , 和 希望 用 此 试验 结果 来 修改 他 原先 对 B 和 B: 
的 看 法 , 即 要 求 条 件 概 率 P(B,|14) 和 P(CB:|4)。 这 项 工作 可 用 贝 叶 斯 公式 来 
完成 。 为 此 需要 两 组 概率 {P(B:)} 和 {P(413)) ,其 中 第 一 组 概率 就 是 经 理 本 
人 的 主观 概率 ;第 二 组 概率 可 以 通过 计算 获得 。 辟 如 ,P(A1B,) 是 表示 每 个 产 
品 是 高 质量 的 概率 为 0.9(B1) 的 条 件 下 ,连续 五 个 产品 都 是 高 质量 (CA) 的 条 件 
概率 。 试验 4 可 看 作 五 重 独立 重复 试验 ,每 次 试验 成 功 的 概率 为 0.9。 故 5 次 
都 成 功 的 概率 为 已 (41B) 一 0.9% 一 0.590。 类 似 可 算得 P(41B,) 一 0.75 一 
0. 168。 和 再 利用 全 概率 公式 算得 PCA) =P (GB I)PCA B) +P(BIPCALB.) = 
0.4X0. 590+0. 6X0. 168=0. 337。 最 后 用 贝 叶 斯 公式 可 算得 


六 Bi14) 一 一 Pr 一 0 33770 700 
_PCAIBAP(B,)) 0.101 
P(A)= pa) “0.337 0300 


这 表明 ,经 理 根 据 试 验 4 的 信息 调整 了 自己 看 法 ,把 对 Bi 与 五 : 的 可 信 程 度 
由 0.4 和 0.6 调整 到 0.7 和 0. 3, 经 理 往 后 的 决策 就 不 用 0.4 和 10. 6, 而 要 用 
0.7 和 0.3。 因 为 0.4 与 0.6 仅 是 经 理 个 人 的 主观 概率 ,而 0.7 和 0. 3 是 综合 
了 经 理 的 主观 概率 和 试验 结果 而 获得 的 ,要 比 主观 概率 更 有 了 吸引 力 ,这 就 是 由 
叶 斯 公式 的 作用 。 | 

经 过 试验 A 后 ,经 理 对 增加 投资 改进 产品 质量 的 兴趣 增 大 。 但 因 投 资 额 
大 ,还 想 再 做 一 次 小 规模 试验 , 观 其 结果 再 作 决 策 ,为 此 又 做 了 一 项 试验 ,试验 
结果 ( 记 作 C) 如 下 : 

C :试制 10 个 产品 ,有 9 个 是 高 质量 产品 。 

经 理 对 此 试验 结果 更 为 高 兴 。 和 希望 用 此 试验 结果 再 一 次 修改 对 B 和 B, 
的 看 法 。 把 0.7 和 0. 3 作为 经 理 的 看 法 。 即 

P(B)=0.7,  P(B,)=0.3 
再 把 试验 C 看 作 十 重 独立 重复 试验 。 可 算得 
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P(C|B,)=10(0. 9)*C0. 1)=0. 387 
P(C|B.)=10(0. 7)*C0. 3)=0. 121 
由 此 可 算得 P(C =P (BIP(CC| BB )+PCBIP(C|B,)=0.7X0. 38740. 3X 
0. 121=0. 307。 最 后 ,由 贝 叶 斯 公式 可 算得 P(B,|C)=0. 883, P (B¿|C)= 
0. 117。 经 理 看 到 ,经 二 次 试验 ,Bi 的 概率 已 上 升 到 O. 883, 到 可 以 下 决心 的 时 
候 了 。 他 能 以 接近 0. 9 的 概率 保证 此 项 投资 能 取得 较 大 效益 。 
例 1. 5.10 据 调 查 某 地 区 居民 的 肝癌 发 病 率 为 0.0004, 石 记 “ 该 地 区 居 
民 串 肝癌 ?为 事件 Bj, 并 记 B¿=B, > Mi 
P(B,)=0.0004, P(B,)=0. 9996 
HA PEA RAMA. £ EHE, RAMA UM A E HE, E E E. 
由 于 技术 和 操作 不 完善 以 及 种 种 特殊 原因 ,是 肝癌 者 未 必 检 出 阳性 ,不 是 患者 
也 有 可 能 呈 阳 性 反应 。 据 多 次 实验 统计 ,这 两 种 错误 发 生 的 概率 为 
P(A|B,)=0.99, P(A|B,)=0.05 
其 中 事件 4 表示 “阳性 ”。 因 此 A 表示 “阴性 ”, 由 此 得 P(A|1B1) 一 0.01。 它 是 
“肝癌 患者 未 必 检 出 阳性 ”的 概率 。 
现 设 某 人 已 检 出 阳性 , 问 他 患 肝 癌 的 概率 P(Bi|A4) 是 多少 ? 这 里 已 知 的 
第 一 组 概率 {P(B;)} 是 从 调查 得 知 ,第 二 组 概率 {P(A|B)}) 是 从 试验 得 知 , 于 
是 可 用 贝 叶 斯 公式 算得 要 求 概率 


PrB 14)= 0.99X0. 0004 


0. 99X0. 0004 十 0. 05X0. 9996 


0. 000396 
一 0. 000396+0. 04998 4/86 


这 表明 ， 在 已 检查 出 旦 阳性 的 人 中 ， 真 患 肝癌 的 人 不 到 1%。 这 个 结果 可 能 会 
使 人 吃惊 ,但 仔细 分 析 一 下 ,就 可 以 理解 了 ,因为 肝 瘤 发 病 率 很 低 ,在 10000 人 
中 ,只 有 4 人 左右 。 而 约 有 9996 人 不 患 肝 癌 。 如 对 这 10000 人 用 甲 胎 蛋 白 法 
进行 检查 。 按 其 错 检 的 概率 可 知 ,4 位 患 肝癌 的 都 呈 阳 性 ,而 9996 位 不 患 肝癌 
人 中 约 有 9996X0. 05=500 个 呈 阳 性 。 在 总 共 504 个 呈 阳 性 者 中 , 真 患 肝癌 的 
4 人 后 总 阳性 中 不 到 1%% ,其 中 大 部 分 人 (500 人 ) 是 属 “ 虚 报 ”。 从 这 个 例子 看 
出 ,减少 “虚报 ”是 提高 检验 精度 的 关键 。 这 在 实际 中 往往 是 不 容易 的 事 。 在 实 
际 中 ,医生 常用 另 一 些 简单 易 行 的 辅助 方法 先进 行 初 查 ,排除 大 量 明 显 不 是 肝 
瘤 的 人 , 当 医 生 怀 疑 某 人 有 可 能 患 肝 癌 时 , 才 建 议 用 甲 胎 蛋 白 法 检验 。 这 时 在 
锌 怀疑 的 对 象 中 ,肝癌 的 发 病 率 已 显著 提高 了 ,比如 说 ,P(Bi) 一 0.4。 这 时 再 
用 贝 叶 斯 公式 进行 计算 ,可 得 / 
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0. 99X0. 4 
0. 99X0. 4 十 0. 05X0. 6 


这 样 就 大 大 提高 了 了 甲 胎 重 日 法 的 准确 率 了 。 

5115.11 伊 索 寅 言 “孩子 与 狼 ?” 讲 的 是 一 个 小 孩 每 天 到 山上 放羊 ,山里 
AWER, B- REELE: RKT! 狼 来 了 !? 山 下 的 村 民 们 闻 声 便 去 打 
狠 ,可 到 了 山上 ,发 现 狼 没有 来 ;第 二 天 仍 是 如 此 ;第 三 天 , 狼 真 的 来 了 ,可 无 论 
小 孩 垮 么 喊叫 ,也 没有 人 来 救 他 ,因为 前 二 次 他 说 了 谎话 ,人 们 不 再 相信 他 了 。 

现 用 册 叶 斯 公式 来 分 析 这 个 富 言 中 村 民 的 心理 活动 ,为 此 先 要 作 一 些 假 
设 。 首 先 假 设 村 民 们 对 这 个 小 孩 的 印象 一 般 ,他 说 谎话 ( 记 为 4,) 和 说 真 话 ( 记 
为 4:) 的 概率 相同 , 即 设 
P(A)=1/2,  P(A,)=1/2 

万 外 和 再 假设 :说 谎话 的 孩子 颈 狼 来 了 ( 记 为 B) 时 , 狼 来 的 概率 为 1/3, 说 真 话 
的 孩子 喊 狠 来 了 时 , 狼 来 的 概率 为 3/4, 即 设 
P(B|AP=1/3,' P(B|A,)=3/4 

当 第 一 次 村 民 上 山 打 狼 ,发 现 狼 没有 来 (B 发 生 了 ) 时 ,村 民 们 对 说 谎话 小 
孩 的 认识 集中 体现 在 条 件 概 率 PAL IB OE, 根据 上 述 假设 ， 利用 页 叶 斯 公式 
不 难 算得 


P(B,|A)= =0. 9296 


P(B|ADPCA,) 


PAI BD) = — 一 一 一 
P(B|ADP(A D +P(B]A PCA») 


类 似 地 可 算得 P(A,1B) 二 3/11==0.2727, 这 表明 村 民 们 对 这 个 小 孩 说 谎话 的 
概率 由 0. 5 调整 到 0.7273 ,可 记 

P(A1)=8/11, P(A,)=3/11 
在 此 基础 上 ,村 民 第 二 次 上 山 打 狼 , 仍 没 看 见 狼 ,这 时 村 民 再 一 次 调整 对 这 个 
小 孩 说 谎话 的 认识 , 即 再 一 次 计算 条 件 概 率 PCA11B), 即 


这 表明 :村 民 们 经 过 两 次 上 当 , 对 这 个 小 孩 说 谎话 的 概率 从 0.5 上 升 到 
0. 8767, 即 十 句 话 中 有 近 九 句 话 在 说 谎 , 给 村 民 留 下 这 种 印象 ， 他 们 听 到 第 三 
次 呼叫 时 怎么 再 会 上 山 打 狼 呢 ? 
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第 一 OOOO 


随机 变量 及 其 概 泰 分 布 


$2.1 随机 变量 


2.1.1 随机 变量 

人 们 对 随机 现象 的 兴趣 常常 集中 在 其 结果 的 某 个 数量 方面 .譬如 ,质量 检 
验 员 在 检查 20 个 产品 中 关心 的 是 不 合格 品 的 个 数 。 若 记 20 个 产品 中 不 合格 
mT X. UXT X 可 能 取 0,1,2,…,20 中 任 一 个 数 , 可 见 此 及 是 变量 ， 
至 于 这 个 和 X 取 哪 一 个 数 要 看 检查 结果 ,事先 不 能 确定 ,故此 美的 取 值 又 带 有 
随机 性 ,这 样 的 变量 又 称 为 随机 变量 。 这 个 随机 变量 X 是 质量 检验 员 的 注意 
扎 。 有 了 随机 变量 后 ,有 关 事 件 的 表示 也 方便 了 。 如 “X 一 2 表示 “20 个 产品 中 
有 2 个 不 合格 品 ” 这 一 事件 ,又 如 “X 委 2? 表 示 “20 个 产品 中 有 不 多 于 2 个 不 合 
格 品 ”这 一 事件 。 

又 如 超级 市 场 的 经 理 很 关心 一 位 顾客 购买 场 内 商品 的 件数 和 顾客 付款 的 
等 待 时 间 。 若 记 顾 客 购买 场 内 商品 件数 为 了 ,这 个 可 能 取 0,1,2,3,4 REE 
HRE. 并 且 Y 取 什 么 数 是 随机 的 ,因为 经 理 并 不 知道 顾客 会 买 几 件 商品 , 故 
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Y 是 一 个 随机 变量 。 经 理 很 关心 这 个 随机 变量 的 取 值 , 若 没 有 购买 任何 一 个 商 
品 (Y= 二 0) 或 只 购买 一 件 商 品 (Y = 二 1) 的 顾客 人 数 很 多 , 即 事件 “Y 了 过 1” 的 概率 
PC7Y 委 1) 很 大 , 则 经 理 就 要 设法 改进 商品 的 进货 品种 ,以 引起 顾客 的 购物 兴 
趣 ,增加 利润 .类似 地 , 知 记 顾客 付款 的 等 待 时 间 为 Z, 则 2Z 取 什 么 值 要 看 当时 
付款 队伍 的 长 短 和 收 款 人 的 操作 ,因而 完全 是 随机 的 , 它 可 以 是 2 分 钟 .4 分 
钟 ,也 可 能 是 0 到 10 分 钟 的 时 间 区 间 内 任 一 个 时 刻 。 经 理 关心 这 个 随机 变量 
Z 的 取 值 。. 若 事件 “Z 之 3? 一 “顾客 付款 的 等 待 时 间 超 过 3 分 钟 ”的 概率 较 大 , 那 
经 理 就 要 设法 增加 付款 的 窗口 ,以 便利 顾客 ,多 做 生意 。 

从 上 面 几 个 例子 可 以 看 出 ,随机 变量 是 研究 随机 现象 的 一 个 重要 工具 ,也 
是 概率 论 的 一 个 基本 概念 。 它 的 一 般 定 义 如 下 : 

定义 2.1.1 假如 一 个 变量 在 数 轴 上 的 取 值 依赖 于 随机 现象 的 基本 结 
采 , 则 称 此 变量 为 随机 变量 ,常用 大 写字 母 叉 ,Y ,2Z 等 表示 ,其 取 值 用 小 写字 
B r yso 等 表示 。 假 如 一 个 随机 变量 仅 取 数 轴 上 的 有 限 个 或 可 列 个 孤立 点 
( 见 图 2. 1. 1), 则 称 此 随机 变量 为 离散 随机 变量 . 假如 一 个 随机 变量 的 可 能 取 
值 充 满 数 轴 上 的 一 个 区 间 (a,5)( 见 图 2.1.2), 则 称 此 随机 变量 为 连续 随机 变 
量 , 其 中 4 可 以 是 一 oo0,b 可 以 是 十 ce。 | 


Xi X X3 Xa As a b 
一 一 一 一 一 一 一 一 
O 
图 2.1.1 离散 随机 变量 的 可 能 取 值 图 2.1.2 连续 随机 变量 的 可 能 取 值 


在 我 们 周围 随机 变量 的 例子 是 很 多 的 ,下 面 的 列子 将 会 给 我 们 一 些 启 发 ， 

612.11 认识 一 个 随机 变量 首先 要 从 它 的 取 值 来 区 分 它 是 离散 随机 变 
量 ,还 是 连续 随机 变量 。 

(1) 抛 一 枚 硬币 ,正面 出 现 次 数 X 是 仅 可 能 取 0 与 1 两 个 值 的 随机 变量 ， 
“总 一 0 表示 “出 现 反面 ”,“X 一 1? 表 示 “ 出 现 正面 "。 类 似 地 ,检查 一 个 产品 ,不 
合格 的 个 数 了 也 是 一 个 仅 能 取 0 与 1 两 个 值 的 随机 变量 。“Y = 二 0” 表 示 “ 合 
m” “YSI RR PAR”. 

DRE ”个 产品 ,不 合格 品 数 和 是 可 能 取 0,1,…,n 等 n 十 1 个 值 的 随 
机变 量 ,“XX 二 zx” 表示 “x 个 产品 中 有 工 个 不 合格 品 ”。 类 似 地 ,n 台 车 床 中 需要 
维修 的 车 床 数 了 也 是 可 能 取 0,1,…,n 等 n 十 1 个 信 的 随机 变量 ,“Y 二 y” 表 
示 “n 台 和 车 床 中 有 y 台 需 要 维修 ”。 

49 


(CO EME MAMAR 了 是 可 能 取 0,1,… 等 一 切 非 负 整 数 的 随机 变 
量 ,“ 允 二 x” 表 示 “ 一 正 布 上 有 工 个 疾 点 ”。 类 似 地 ,一 本 书 上 错别字 的 个 数 、 城 
市 的 十 字 路 口 一 分 钟 内 通过 的 机 动车 辆 数 、 顾 客 在 超市 中 购买 南 品 件数 都 可 
看 作 取 一 切 非 负 整 数 的 随机 变量 。 

以 上 都 是 离散 随机 变量 ,离散 随机 变量 常常 与 计数 过 程 联系 在 一 起 .而 连 
续 随 机 变量 常常 与 测量 过 程 联 系 在 一 起 。 下 面 是 一 些 连续 随机 变量 的 例子 。 

(4) 测 量 误差 关 是 可 在 (一 co ,co) 上 取 值 的 随机 变量 ,。 “|X| 志 1” 表 示 “ 测 
量 误差 XX 在 [一 1, 十 1j 内 ”。 | 

(5) 电 视 机 的 寿命 Y( 单 位 ;小 时 ) 是 (0,co) 上 取 值 的 随机 变量 ,“Y > 
10000” 表 示 “ 电 视 机 寿命 超过 一 万 小 时 ”。 类 似 地 ,小 客车 每 公里 的 耗 油 量 Y 
(单位 : 升 ) 也 可 看 作 在 (0,ce) 上 取 值 的 随机 变量 .“yY 委 0. 5” 表 示 “ 小 客车 每 公 
里 的 耗 油 量 不 超过 半 升 。” 

(6) 汽 车 司机 使 用 刹车 时 轮胎 接触 地 面 的 点 的 位 置 X 是 在 [0,2xrj 上 了 
值 的 随机 变量 ,其 中 r 是 轮胎 的 半径 ，。 


2.1.2 随机 变量 的 概率 分 布 
直观 地 说 ,随机 变量 就 是 “随机 取 值 的 变量 ”, 或 者 说 是 “ 取 值 随机 会 而 定 
的 变量 ”。 但 要 认识 一 个 随机 变量 就 不 能 仅 停 留 在 这 种 感觉 上 ,还 应 认识 如 下 
ZA: 
(1) 随 机 变量 七 可 能 取 哪 些 值 ,或 取 值 范围 是 什么 ? 
(2) 随 机 变量 X 取 这 些 值 的 概率 是 多 少 ? 
关于 随机 变量 的 取 值 在 上 一 小 节 已 讨论 过 了 ,这 里 将 着 重 讨论 随机 变 
EX 取 值 的 概率 ,在 定义 2. 1. 1 中 随机 变量 X 的 “ 取 值 依赖 于 基本 结果 ”的 说 
法 意味 着 随机 变量 X 是 基本 结果 w 的 函数 , 即 可 把 AX wA Xw), 
X =X Ww), w E (1 | 
这 里 要 补充 说 明 一 句 : 对 随机 变量 和 来 说 ,不 容许 基本 空间 Q 中 有 一 个 
基本 结果 w 没有 实数 与 其 对 应 ,综合 上 述 ,随机 变量 也 可 看 作 定 义 在 基本 空 
[El a= {w LERA. 在 这 个 认识 上 ,“ 随 机 变量 义 的 取 值 为 <? 就 是 满足 等 
A X(w)=x 1 ww 组 成 的 集合 ,用 “和 =z?" 表 示 , 即 
“X=1=(0:X (0) =x) 00 
类 似 地 ,“ 随 机 变量 X 的 取 值 小 于 或 等 于 z? 就 是 满足 不 等 式 X(wo) 委 zx 的 一 切 
o ARRE M XSI” RR, Rp 
“KIr” = {w Xlo) Lr c 
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特别 “和 X 委 oo? 是 必然 事件 M XS oo ?是 不 可 能 事件 。 以 后 会 看 到 ,上 述 两 
种 形式 的 事件 是 典型 事件 。 譬如 ,要 确定 一 个 离散 随机 变量 X 取 值 的 概率 ,只 
要 对 其 可 能 取信 确定 形 如 “X= 二 "事件 的 概率 即 可 ( 详 见 》2. 2.1). 而 对 一 
般 随 机 变量 X, 要 确定 它 取 值 的 概率 ,就 要 对 任意 实数 e METE MX <i> $ 
件 的 概率 即 可 ,而 这 类 事件 的 概率 POSO E r A) E r 变化 而 变化 ， 
夺 把 这 个 函数 记 为 (zx), 并 能 确定 这 个 消 数 , 则 形 如 “XX 过 xz” 的 事件 的 概率 
也 随 之 确定 。 这 个 了 沙 数 F(z) 称 为 分 布 函 数 , 是 概率 论 中 的 一 个 重要 概念 ,也 是 
计算 随机 变量 X 有 关 事 件 的 概率 的 重要 工具 , 它 的 一 般 定义 如 下 。 

定义 2.1.2 设 习 为 一 个 随机 变量 ,对 任意 实数 r, FF XSL WAR 
E zx AR, MAY 

F(xr)=P(X<z) 

这 个 孙 数 称 为 站 的 累积 概率 分 布 孙 数 ,简称 分 布 函 数 ， 

在 上 述 定 义 中 并 没有 限定 随机 变量 X 是 离散 的 或 是 连续 的 。 不论 离散 随 
机 变量 还 是 连续 随机 变量 都 可 谈论 分 布 函数 ,都 有 各 自 的 分 布 函数 .从 分 布 函 
数 定义 容易 看 出 它 的 一 些 基 本 性 质 。 

DIS OS. HUE, A URETA XX <a RR, Mí 
概率 总 在 0 与 1 之 间 。 

(2 有 (一 so) 一 lim Fz) 一 0。 这 是 因为 事件 *X 委 一 ce? 是 不 可 能 事件 之 
故 。 

S)F(+00)= lim FFCz) 一 1], 这 征 因为 事件 “X 委 十 ce?” 是 必然 事件 之 故 。 
(4)F(z) 是 非 降 鲨 数 , 即 对 任意 zx 二 zs, 有 (zi) 声 F(xs)。 这 是 因为 事件 

PLESUICE 3D ESCALAR 

(F Cr) EA E AA, EN Ftx)=F(<+ 0) HP Fir +OK r 
处 的 右 极限 ,对 任意 给 定 的 xz, 取 一 个 下 降 数 列 {x,} ,使 其 极限 为 x, E| 

CSL o D>, > (n-»00) 
则 
AZz 二 0) 一 Jim 天 (Zn) 

这 一 点 将 结合 下 面 例子 给 予 说 明 。 

例 2.1.2 取暖 器 有 二 种 :一 种 是 用 电 作 动力 的 ( 记 为 巨 ), 另 一 种 是 用 煤 
气 作 动力 的 ( 记 为 G)。 有 三 位 顾客 到 大 型 商场 去 各 购买 一 台 取 上 暖 器 . 若 定义 如 
下 一 个 随机 变量 . 

天 一 三 位 顾客 共 购 买 煤气 取暖 器 的 台数 
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而 随机 现象 (三 位 顾客 购买 取暖 器 ) 的 基本 结果 有 多 种 ,如 第 一 、 第 三 位 顾客 买 
的 是 煤气 取暖 需 , 而 第 二 位 顾客 买 的 是 电 取 暖 器 ,此 时 基本 结果 可 表示 为 
GEG ,对 此 基本 结果 ,随机 变量 多 的 取 值 为 2。. 类 似 地 可 把 全 部 基本 结果 及 了 X 
相应 取 值 罗列 如 下 : 


基本 结果 | EEE EEG EGE GEE EGG GEG GGE GGG 


可 见 X 是 定义 在 基本 空间 0Q( 含 有 EEE 等 8 个 基本 结果 ) 上 的 一 个 实 值 函 
数 , 并 且 只 取 四 个 值 0,1,2,3, 故 X 是 离散 随机 变量 ， 

夺 从 市 场 调 研 知 ,在 欲 购 取 暖 器 的 顾客 中 60% 要 购 电 取暖 器 ,40% 要 购 
煤气 取暖 部 , 即 PCE) 二 0.6,P(G)==0.4, 假 如 三 位 顾客 购置 取暖 器 是 相互 独 
立 的 , 则 可 算得 每 个 基本 结果 发 生 的 概率 , 壁 如 

PC(EEE)=0. 6*=0. 216 
P(EEG)=0. 6*Xx0. 4=0. 144 
于 是 又 可 算得 和 取 0,1,2,3 等 四 个 值 的 概率 
P(X=0)=P(EEE)=0. 216 
P(X=1) =P(EEGUEGEUGEE)=3X0. 144=0. 432 
P(X=2)=P(EGGUGEGUGGE)=3X0. 6X0. 42=0, 288 
| P(X=3)=P(GGG)=0. 4*=0. 064 | 
上 述 四 个 概率 之 和 恰好 为 1, 这 样 的 一 组 概率 在 概率 论 中 称 为 一 个 概率 分 布 ， 
或 分 布 列 ,并 可 表示 如 下 : 


P O. 216 0. 432 0. 288 0. 064 


,利用 分 布 列 可 以 算得 一 些 更 复杂 事件 的 概率 , 壁 如 ,事件 “三 位 顾客 中 最 
多 有 一 位 购置 煤气 取暖 器 ”可用 “X 入 1? 表 示 ,相应 概率 为 
P(X<I)=P(X=0)+P(X=1)=0. 648 
类 似 地 ,可 以 计算 其 它 一 些 事件 的 概率 

P(X>D)=P(X=1)+P(X=2)+P(X=3)=0. 784 
PUSXS2 =P(X=1)+P(X=2)=0. 720 

最 后 ,利用 这 个 分 布 列 容易 写 出 X 的 分 布 函数 
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O, Z< 0 
0.216, 0<i<l - 


Fta)=P(X<xi)=30. 648, 1<i<2 
1, 3x1 


这 是 定义 在 整个 实数 轴 上 的 函数 ,其 图 形 ( 见 图 2.1. DABA E A Al Br 
点 正好 是 和 可 能 取 的 四 个 值 上 ,在 这 些 间断 点 上 的 函数 值 等 于 该 函数 的 右 极 
限 ,所 以 这 个 函数 是 右 连 经 的 , 男 外 ,在 回 断 点 上 对 数 F(x) 的 跃 度 从 低 到 高 依 
KAX 0,1,2,3 的 概率 。 


F(x) 


0 1 2 3 xX 
B 2.1.2 MER X ME 0,1,2,3 等 四 个 值 ( 例 2.1.2) 的 分 布 函 数 


例 2.1.3 在 超市 顾客 排队 等 候 付款 时 间 ( 简 称 等 候 时 间 )T 是 在 (0,co) 
上 到 值 的 连续 随机 变量 , 某 超 市 对 顾客 等 候 时 间 的 大 量 观察 和 研究 后 得 到 如 
下 结果 ,顾客 等 候 时 间 不 超过 i( 实 0) 分 钟 的 概率 P(T<z) 可 用 指数 函数 1 一 
e “计算 ,而 当 t<0 时 ,事件 “了 <:” 是 不 可 能 事件 ,这 表明 ,顾客 等 候 时 间 工 的 
分 布 函数 为 
F(t)= 2» <o 
l—e"*, t20 
其 中 AM>0 是 待定 参数 , 它 根 据 超 市 具体 情况 而 定 , 若 设 4==0. 3, 可 以 算得 一 
ESA AB 
F(2)=P(T<2)=0. 451 
-FU4)=P(TLÍA)=0. 699 
F(65)=P(T<6)=0. 834 
F(38)=P(T<X8)=0. 909 
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这 些 概率 表明 ,在 1000 名 顾客 中 排队 付款 的 等 待 时 间 不 超过 2 分 钟 的 约 
有 451 人 左右 ,不 超过 4 分 钟 的 约 有 699 人 左右 ,不 超过 6 分 钟 的 约 有 834 人 
左右 ,不 超过 8 分 钟 的 约 有 909 人 左右 ,把 这 些 概率 点 在 坐标 纸 上 , 可 以 画 出 
FRAR FG) 的 曲线 。 在 1 过 0 时 ,FQ)= 二 0; 在 1 宇 0 时 ,G4) 是 一 条 连续 上 升 
的 曲线 (图 2.1.3), 但 上 升 速 度 逐 渐 减 慢 , 最 后 以 (4) = 二 1 为 渐 近 线 。 


F(t) 


0 2 4 6 8 10 t 
2.1.3 顾客 付款 等 候 时 间 了 了 的 分 布 函数 F(z) 


利用 这 个 分 布 函 数 还 可 计算 更 复杂 事件 的 概率 , 辟 如 ,顾客 等 待 时 间 超 过 
1 分 钟 但 不 超过 5 分 钟 的 概率 为 
PC(1<T 委 5) 王 PT 和 5) 一 P(T 近 1) 
=F(5)—F(1) =0. 777—0, 259=0. 518 
这 表明 ,等 待 时 间 在 (1,5] 内 的 可 能 性 要 超过 0.5, 即 有 一 半 以 上 顾客 等 待 时 
HA 1 分 钟 到 5 分 钟 之 间 。 
由 此 可 见 , 当 有 了 分 布 函数 之 后 ,计算 各 种 事件 的 概率 就 容易 多 了 。 这 样 
一 来 ,确定 一 个 随机 变量 的 分 布 函 数 将 成 为 一 个 关键 问题 ,这 将 在 以 后 介绍 。 


2. 1.3 概率 的 可 列 可 加 性 公理 

在 进一步 研究 中 将 会 涉及 无 穷 多 个 事件 的 概率 ,这 就 要 求 我 们 把 概率 公 
理化 定义 (定义 1. 2.1) 中 的 可 加 性 公理 用 更 强 的 可 列 可 加 性 公理 来 代替 ， 

可 列 可 加 性 公理 者 4 ,4 ,… 是 一 列 互 不 相 容 事件 , 则 有 


PLUA,)= 2 P(A,) 
此 公理 与 非 负 性 公理 .正则 性 公理 一 起 组 成 新 的 公理 体系 , 它 使 可 列 个 事 
件 经 运算 后 所 得 事件 可 谈 及 概率 ,为 了 说 明 前 面 所 推 得 的 一 些 概率 性 质 仍 然 
成 立 , 从 逻辑 上 看 ,还 需要 从 新 的 公理 体系 出 发 来 证 明 ( 有 限 ) 可 加 性 成 立 , 这 
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一 点 将 放 在 习题 2. 1. 10 里 进行 。 


$2.2 AMEE 


2.2.1 离散 随机 变量 的 分 布 列 
定义 2.2.1 设 X 是 离散 随机 变量 , 它 的 所 有 可 能 取 值 是 Tis Ts” dn 
+ BMX E zi 的 概率 为 
P(X=2x)=p(2)=>0, ¿i=1,2,**",.n,*" (2.2.1) 


且 满 足 如 下 条 件 : 


5 Cd 1 
则 称 这 组 概率 {p(xi)) 为 该 随机 变量 X 的 分 布 列 , 或 瑟 的 概率 分 布 , 记 为 刁 一 
p<) ERE X 服 从 分 布 {p (zi))。 
若 已 知 离 散 随 机 变量 X 的 分 布 列 为 {p RO) RABO XX 的 分 布 消 数 


F(z)= 2 plz) (2. 2. 2) 
但 在 离 做 随机 变量 场合 ,使 用 分 布 列 更 为 方便 , 故 名 用 分 布 列表 未 离散 随机 恋 
量 的 概率 分 布 , 非 必要 时 不 使 用 分 布 函 数 。 
离散 随机 变量 X 的 分 布 列 除 用 (2. 2. 1) 式 表示 外 ,还 用 如 下 列表 方式 表 
示 ,但 要 注意 表示 要 上 下 位 置 对 应 ,不 要 错位 。 


pEr) plr) 
此 外 ,分 布 列 还 有 两 种 图 表示 法 :线条 图 与 概率 直方 图 (图 2. 2. 1)。 下 面 将 结 
台 例 子 来 介绍 这 两 种 图 ， 
例 2.2.1 在 例 2.1.2 中 有 三 位 顾客 在 选 购 电 取暖 嚣 和 煤气 取暖 器 ,他 
们 共 购 买 燥 气 取 上 暧 姨 台数 X 是 离散 随机 变量 ,在 假设 购置 电 取 暖 器 的 概率 为 
0. 6 ,购置 煤气 取暖 器 的 概率 为 0. 4 的 条 件 下 ,获得 X 的 如 下 分 布 列 ， 


X 0 l 2 3 
P 0.216 0.432 0.288 0.064 


现 用 这 个 分 布 列 来 介绍 它 的 线条 图 与 概率 直方 图 。 线 条 图 (图 2. 2. 1(a)) 

古 以 牌 线 长 度 才 示 分 布 列 中 各 个 概率 ,图 中 各 线条 长 度 之 和 为 1。 概率 直方 图 

(图 2. 2. 1 (b)) 是 以 长 方形 面积 表示 分 布 列 中 各 个 概率 ,图 中 各 长 方形 面积 之 
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和 为 1。 无 论 垂 线 还 是 长 方形 ,它们 都 置 于 X 的 相应 取 值 之 上 。 但 这 两 张 图 的 
纵 坐 标 是 有 差别 的 。 线 条 图 的 纵 坐 标 是 概率 刻度 ;概率 直方 图 的 纵 坐 标 是 以 
“概率 /组 距 ” 来 标明 刻度 的 ,其 中 组 距 是 长 方形 底部 宽度 。 使 用 概率 直方 图 常 
要 求 各 长 方形 联 成 一 片 ,否则 就 用 线条 图 。 上 述 分 布 列 的 线条 图 与 概率 直方 图 
如 图 2.2.1 所 示 , 这 两 张 图 可 使 分 布 列 给 人 们 留 下 直观 的 印象 。 


P 2/ 组 距 
0.4 0,4 
0.2 0.2 
0 1 2 3 x 0 1 2 3 x 


(a) 分 布 列 的 线条 图 (b) 分 布 列 的 直方 图 
2.2.1 分 布 列 的 线条 图 与 直方 图 
p(x) 


. 20 


. 20 


15 

. 10 

li 
B q 
0 1 2 3 4 5 6 7 8 9 10 


2.2.2 例 2.2.2 的 分 布 列 的 概率 直方 图 


ql 


X 
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例 2.2.2 消费 者 协会 收 到 大 量 顾客 的 来 信 , 申 诉 他 们 购买 的 空调 器 中 
的 质量 问题 . 消费 者 协会 对 此 作 了 整理 后 提出 空调 器 重要 缺陷 数 义 的 分 布 列 


P 10.041 0.130 0.209 0.223 0.178 0.114 0.061 0.028 0.011 0.004 0. 001 


其 中 这 些 概率 都 是 用 统计 方法 确定 的 ,其 和 为 1。 此 分 布 列 的 概率 直方 图 
如 图 2. 2. 2 所 示 。 从 图 可 以 看 出 ,多 数 空调 器 的 缺陷 数 在 1 到 5 之 间 , 而 超过 
6 个 缺陷 的 空调 器 是 较 少 的 。 用 此 分 布 可 以 算得 下 列 事件 的 概率 : 

PT 入 和 和 过 5) 一 PC1L) 十 已 (2) 十 已 (3) 十 已 (4) 十 已 (5) 一 0. 854 
P(X>6)=P(7)+P(8)+P(9)+P(10)=0.044 
例 2.2.3 检查 下 面 的 数列 是 否 能 组 成 一 个 概率 分 布 


Daa) =T, x=1,2,3,4 


q 
2p) => x=0,1,2,3,4 


(3)ps(7)=2 ,z=1,2,% ,m,*"" 

解 :数列 (1) 不 能 组 成 一 个 概率 分 布 ,因为 p.(1) 为 负 。 

数列 (2) 也 不 能 组 成 一 个 概率 分 布 ,因为 它 的 5 个 概率 之 和 为 6/5, 
大 于 1。 / 

数列 (3) 是 一 个 概率 分 布 ,因为 其 每 个 数 都 大 于 零 , 其 和 又 恰好 为 1。 


2.2.2 离散 随机 变量 的 数学 期 望 

“期 望 ? 在 日 常生 活 中 常 指 有 根据 的 希望 ,或 发 生 可 能 性 较 大 的 希望 。 警 
如 ,一 位 人 寿 保 险 经 纪 人 告诉 我 们 :“ 在 美国 40 岁 的 妇女 可 期 望 再 活 38 年 。” 
这 不 是 说 40 岁 的 美国 妇女 都 活 到 78 岁 , 然 后 第 二 天 去 世 , 而 是 指 40 岁 的 美 
国 妇 女 中 ,有 些 可 再 活 20 年 ,有 些 再 活 50 年 ,平均 可 再 活 38 年 , 即 再 活 38 年 
左右 (如 再 活 384 10 年) 的 可 能 性 大 一 些 ; 又 如 ,*“ 某 种 轮胎 可 期 望 行驶 6 万 公 
里 ”, 也 是 指 此 种 轮胎 平均 可 行驶 6 万 公里 ,就 个 别 轮胎 来 说 ,有 的 行驶 可 超过 
6 万 公里 ,有 的 行驶 可 能 不 到 6 万 公里 就 报废 ,而 行驶 6 万 公里 左右 的 可 能 性 
大 一 些 。 下 面谈 及 的 “数学 期 望 > 是 指 用 概率 分 布 算得 的 一 种 加 权 平 均 , 它 是 概 
率 论 中 的 一 个 基本 概念 。 

数学 期 望 概念 起 源 于 赌博 , 先 看 下 面 的 例子 。 

例 2. 2.4 (分 赌 本 问题 ) 17 世纪 中 时 一 位 赌 徒 向 法 国 数学 家 帕斯卡 
(1623 全 1662) 提 出 一 个 使 他 苦恼 长 久 的 分 赌 本 问题 :甲乙 两 位 赌 徒 相约 ,用 挪 
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硬币 进行 赌博 , 谁 先 赢 三 次 就 得 全 部 财 本 100758. ARA MR LARA 
次 时 ,他 们 都 不 愿 绸 赌 下 去 了 , 问 赌 本 应 如 何 分 呢 ? 这 个 问题 引起 不 少 人 的 兴 
趣 。 有 人 建议 按 已 说 次 数 的 比例 来 分 赌 本 , 即 甲 得 全 部 赌 本 的 2/3, 乙 得 其 余 
的 1/3; 有 人 反对 ,认为 这 全 然 没 有 考虑 每 个 赌 徒 必须 再 万 的 次 数 。1654 年 帕 
斯 加 提出 如 下 解法 :在 甲 已 赢 二 次 和 乙 只 赢 一 次 时 ,最 多 只 需 再 玩 二 次 即 可 结 
束 这 次 赠 博 ,而 再 玩 二 次 可 能 会 出 现 如 下 四 种 结果 : 


s A (91 y w3 Wi 
次 数 

1 | EA IH Z 乙 

2 HH © EA 乙 


其 中 前 三 种 结果 01 007,003 中 任 一 个 发 生 都 使 甲 得 100 法 郎 , 只 有 当 or 发 生 ， 
息 得 0 法 即 ( 即 乙 得 100 法 郎 ) ,由 于 这 四 种 结果 是 等 可 能 的 , 故 甲 得 100 法 郎 
的 概率 为 3/4, 而 得 0 法 郎 的 概率 为 1/4, 从 而 甲 应 期 望 得 到 100X (3/4)=75 
法 胃 ,完整 地 说 , 甲 应 期 望 得 到 


100x $ +0x 4 =75 ERP) 


这 议 是 帕 斯 加 的 答案 ,其 意 指 , 若 再 继续 此 种 赌博 多 次 , 甲 每 次 平均 可 得 75 法 
BB. 

由 斯 加 的 解法 引出 数学 期 望 概念 ,从 分 布 的 观点 看 这 个 问题 , 甲 赢 得 的 法 
明 数 XX 是 一 个 随机 变量 , 它 仅 可 取 两 个 值 ,zi 二 100 和 zs 二 0, 取 这 些 值 的 概率 
分 别 为 

plar=P(X=x1)=3/4, plr) =P(X=r;,)=1/4 
XAT F MARR R A E 
X 的 数学 期 望 一 zip (a) + xp lx) 

这 就 是 计算 数学 期 望 的 公式 , 它 的 一 般 定义 如 下 

定义 2.2.2 设 离散 随机 变量 X 的 分 布 列 为 


P=(X= zr) = plx), 一 上 ，2 7 
则 和 式 3)” mp) BAN A 的 (或 分 布 的 ) 数学 期 望 , 记 为 
E(X) 一 Y), tip (zi) (2. 2. 3) 


Pim X OBEATA, AFRE DIES FED Se 
和 为 X 的 (或 分 布 的 ) 数学 期 望 , 记 为 
EX) = y Tip zi) (2.2.4) 
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假 媚 上述 无 穷 级 数 不 绝对 收敛 , 则 说 该 随机 变量 X 的 (或 分 布 的 ) 数 学 期 请 不 
存在 、 当 数学 期 望 存 在 时 , 稼 简称 它 为 期 望 ,期望值 .均值 等 。 

例 2.2.5 某 推销 人 与 工厂 约定 ,用 船 把 一 箱 货物 按期 无 损 地 运 到 目的 
地 可 得 佣金 10 元 ,大 不 按期 则 扣 2 元 , 若 货 物 有 损 则 扣 5 元 , 若 既 不 挨 期 又 有 
损坏 则 扣 16 元 。 推 销 人 按 他 的 经 验 认为 ,一 箱 货 物 按期 无 损 地 运 到 目的 地 有 
60% 把 握 , 不 按期 到 达 占 20% ,货物 有 损 占 10% ,不 按期 又 有 损 的 占 10%% 。 试 
问 推销 人 在 用 船 运送 货物 时 ,每 箱 期 望 得 到 多 少 ? : 

解 : 设 X 表示 该 推销 人 用 船 运送 货物 时 每 箱 可 得 钱 数 , 则 按 题 意 ,X 的 分 
布 为 


X 10 8 9 —6 


P O. 6 0. 2 0.1 0. 1 


按 数 学 期 望 定 义 2. 2. 2 ,该 推销 人 每 箱 期 望 所 得 
E(X)=10X0. 6 十 8X0.2 十 5X0.1 一 6X0. 1 
一 7.5 元 
假如 推销 人 一 次 能 押运 200 箱 货 物 , 则 他 期 望 ( 平 均 ) 得 到 
200XE(Cz) 一 200X7.5 一 1500 元 
例 2.2.6 在 有 N 个 人 的 团体 中 普查 某 种 疾病 需要 逐个 验 血 , 若 血 样 呈 
阳性 , 则 有 此 种 疾病 ; 旦 阴性 , 则 无 此 种 疾病 。 逐 个 验 血 需 检 验 N 次 ,车 N 很 
大 , 那 验 血 工作 量 也 很 大 。 为 了 能 减少 工作 量 ,一 位 统计 学 家 提出 一 个 想法 :把 
k 个 人 (之 2) 的 血样 混合 后 再 检验 , 若 呈 阴性 , 则 上 个 人 都 无 此 疾病 ,这 时 丰 
个 人 只 需 作 一 次 检验 ; 若 呈 阳性 , 则 对 有 个 人 再 分 别 检 验 , 这 时 为 弄 明 白人 堆 有 
此 种 疾病 检验 & 十 1 次 。 若 该 团体 中 得 此 疾病 的 概率 为 p, 且 得 此 疾病 相互 独 
立 。 试 问 此 种 验 血 办 法 能 否 威 少 验 血 次 数 ? 若 能 减少 , 那 能 减少 多 少 工作 
H., 
解 : 令 X 为 该 团体 中 每 人 需要 验 血 次 数 , 则 按 题 意 ,X 是 仅 取 二 个 值 的 随 
机 变量 ,其 分 布 为 


X 1/% 1+1/2 


P (I—p) 1-(1—p)' 


则 每 人 平均 验 血 次 数 为 
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E(X) =} APR ORD AP] 


=1-(1-p+ 到 
而 新 的 验 血 方法 比 逐 个 验 血 方法 平均 能 减少 验 血 次 数 为 


1—E(X)=(—p)}— 4 


E LEQ0<1WMITEREA DRAMA, sm 当 p=0.1,2=2H),1—E(X) 
=1—0. 69=0. 31 , 即 平均 每 人 减少 0. 31 次 。 若 该 团体 有 10000 人 , 则 可 减少 
3100 次 , 即 减 少 31% 的 工作 量 。 对 & 为 其 它 值 时 , 亦 可 类 似 计算 ,计算 结果 列 
于 表 2.2. 1 中。 

从 该 表 可 见 , 当 p(=0.1) 已 知 时 ,可 选 出 一 个 ho(=4) ,使 得 EC(X) 最 小 。 
此 时 把 个 人 的 血样 混在 一 起 用 新 方法 检验 ,可 使 平均 验 血 次 数 最 少 ,达到 
最 大 的 效益 。 其 它 的 & 值 效益 就 不 是 最 大 ,特别 在 p=0. 1,4234 时 反而 要 增 
加 平均 验 血 次 数 。 


表 2.2.1 平均 验 血 次 数 (p=0. 1) 


k EX) 1—E(X)(%) 
2 0. 6900 31.00 
3 0. 6043 39. 57 
4 0. 5939 40. 61 
5 0. 6095 39. 05 
6 | 0.6352 | 36.48 
7 0. 6646 33. 54 
8 0. 6954 30. 55 
10 0.7513 24. 87 
15 0. 8608 13. 92 
20 0. 9264 7.36 
25 0. 9682 3. 18 
30 0. 9909 0. 91 
34 1.0015 一 0.15 


例 2.2.7 有 一 批 产品 ,其 不 合格 品 率 为 p ,检验 员 一 个 接 一 个 地 检查 产 
品 , 直 到 发 现 第 一 个 不 合格 唱 时 才 停 止 检查 。 若 记 为 首次 出 现 不 合格 品 的 
RARS, M X ERR 1,2,3,… 等 一 切 自然 数 的 随机 变量 . 事件 “了 =5” 表 示 
前 4 次 得 合格 品 , 而 第 5 次 得 不 合格 品 。 考 虑 到 这 批 产 品 很 多 ,可 认为 每 次 抽 
检 都 相互 独立 , 故 
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P(X=5)=p(1- pp) 
一 般 场 合 ,我 们 有 
pr)=P(X=7z)=p(1—p) ,r=1,2, 
这 是 一 个 概率 分 布 , 因 为 其 每 个 概率 均 为 正 , 其 和 


z- 1 
Sp — py =$: 0p! 


x=] 


这 个 分 布 称 为 几何 分 布 , 它 的 数学 期 望 ( 下 设 g = 1 p) 
E(X) 一 J apg = pò ag 
其 中 rg 可 看 作 是 % 对 4q 的 导数 ,再 利用 求 和 与 求 导 运算 的 可 交换 性 ,可 得 
EX) =p)” ACÈ = P ADNA 
— 4| 1 | ,1 _ 1 
=P ilr] 1-9? p 


这 表明 :几何 分 布 的 数学 期 望 为 pE p= 1 MER EAS ER m F 
检查 次 数 为 p :一 10。 


2.2.3 二 项 分 布 

离散 随机 变量 的 概率 分 布 简称 为 离散 分 布 。 下 面 将 叙述 三 种 在 实际 中 最 
常用 的 离散 分 布 ,这 里 先 狼 述 二 项 分 布 。 

在 1.4.4 中 叙述 的 n 量 贝 努 里 试验 有 如 下 几 个 特点 : 

DEZA 次 相互 独立 的 试验 ; 

(2) 每 次 试验 只 可 能 有 两 个 结果 ;成 功 与 失败 ; 

(3) 每 次 出 现成 功 的 概率 相同 , 缘 为 po | 
在 那里 我 们 曾 用 至 .表示 事件 “> 重 贝 努 里 试验 中 成 功 出 现下 次 ”如 今 我 们 用 
随机 变量 来 表示 这 个 事件 。 设 为 n 重 贝 努 里 试验 中 成 功 的 次 数 , 则 有 B= 
X=", KP X 可 能 取 的 值 为 0,1,…,n, 它 取 这 些 值 的 概率 为 


POX=z)=| "pap =0,1,"".,2 (2. 2.5) 
由 二 项 式 定 理 可 知 , 上 述 十] 个 概率 之 和 为 1， 
L PX = 1) = 5| "|a =p)” 


=l|p+4A—=pI=1] 
EIA AA IEN bC D), 它 被 2( 正 整数 ) 和 加 (0< 关 一 1) 两 
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个 参数 唯一 确定 。 在 概率 论 中 “随机 变量 X 的 概率 分 布 为 二 项 分 布 2(m p)” A 
被 说 成 “随机 变量 X 服从 二 项 分 布 ba p)”, FICA FX ~b, p). 
二 点 分 布 n= 1 时 的 二 项 分 布 6(1,p) 又 称 为 二 点 分 布 ,或 称 0 一 1 分 
作 , 其 分 布 为 
P(X = 2) = #0 — p), =0,1 (2.2.6) 
其 中 和 表示 在 一 次 贝 努 里 试验 里 的 成 功 次 数 。 
二 项 分 布 的 数学 期 望 ” 设 铸 ~ 5(n,p), 由 数学 期 望 定义 知 


- n x o #n— T 
E(X) = D|” pO — p) 
其 中 
2 "]=2- nl MDL ”— 1 

ZI(2 — ad (1 — 1) — xz) \z—l 
代 回 原 式 后 ,有 

E(X) =p Y) |” l| yma py" 

r=] =—1 


= >|" - t) a 一 户 )” 

= np[p it (1 pm 

— np 
最 后 结果 表明 ,二 项 分 布 5(n,p) 的 数学 期 望 为 np, 即 在 nn 重 贝 努 里 试验 中 ,成 
功 出 现 的 平均 次 数 为 np. 

例 2.2.8 甲乙 .两 会 人 打靶 ,各 人 命中 率 依次 为 0.2,0.5,0.8。 若 每 人 

ATAR ARICA Y 2 为 各 人 命中 次 数 , 则 它们 都 服从 二 项 分 布 , 具 体 如 
F: 


X ~b(5,0.2), pla) = o 270. 8” * 
X =b(5,0.5), pO) = 5jos 
2 一 045,0.8)， p(z) = >] 0. 8"0.2 


CARA EAT PA PRO O 
= E(X)=1, E(Y)=2.5, E(Z)=4 
由 于 两 的 命中 率 最 高 , 故 其 平均 命中 次 数 也 最 多 ,这 里 平均 命中 次 数 是 指 很 多 
次 打靶 ( 每 次 打 五 发 ) 的 平均 值 。 就 某 次 打气 (各 打 五 发 ) 中 丙 的 命中 次 数 可 能 
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会 低 于 乙 ,甚至 低 于 甲 的 命中 次 数 。 虽 这 种 可 能 性 较 小 ,但 仍 可 能 发 生 。 

最 后 ,我 们 来 比较 这 三 个 二 项 分 布 , 它 们 虽 都 取 0,1,2,3,4,5 等 六 个 值 ， 
日 各 分 布 取 这 些 值 的 概率 是 不 同 的 。 表 2. 2. 2 列 出 这 三 个 二 项 分 布 取 值 的 概 
率 。 用 这 些 概率 可 作出 这 三 个 二 项 分 布 的 概率 直方 图 ( 见 图 2. 2.3). 


05 P(x) 0 P(Y) 0.5 P(2) 
0.4 0.4 0.4 
0.3 0.3 0.3 
0.2 0.2 0.2 
0.1 0.1 0.1 
0 0 0 
0 1234 5x 0 1 234857 0 1 234 5z 


(a) b(5, 0.2), TEM (b) 5(5，0.5)， 对 称 (c) b(5, 0.8), 44% 
图 2.2.3 二 项 分 布 的 概率 直方 图 


表 2.2.2 n= 二 5,p 一 0.2,0.5,0. 8 的 二 项 分 布 


WIE 0 ] 2 3 4 5 
plz) 0. 3277 0. 4096 0. 2048 0. 0512 0. 0064 0. 0003 

py) 0. 0312 0. 1563 0. 3125 0.3125 0. 1563 0. 0312 

p(z) 0. 0003 0. 0064 0. 0512 0. 2048 0. 4096 0. 3277 


n 


从 图 2.2.3 可 以 看 出 , 当 p=0. 5 时 ,由 于 n—y =|” , 故 有 pO)= pla 


一 y) ,这 意味 着 此 种 二 项 分 布 的 概率 直方 图 是 对 称 的 ,如 图 2. 2. 3(b) 所 示 , 当 p 
天 0.5 时 ,相应 二 项 分 布 的 概率 直方 图 是 不 对 称 的 , 呈 偏 态 状 ,上 且 带 有 长 尾巴 , 当 
p<0. 5( 如 p=0. 2) 时 ,尾巴 在 右边 ,此 时 称 为 正信 ,如 图 2. 2. 3(a) 所 示 ; 当 p> 
0. 5 如 z 一 0.8) 时 ,尾巴 在 左边 ,此 时 称 为 负 偏 ,如 图 2. 2. 3(c) 所 示 ,概率 直方 
图 的 形状 给 我 们 研究 二 项 分 布 会 带 来 一 些 重要 信息 。 

例 2.2.9 甲乙 两 棋 手 约定 进行 10 盘 比 赛 , 以 赢 的 盘 数 较 多 者 胜 , 设 在 
每 盘 中 甲 赢 的 概率 为 0.6, 乙 赢 的 概率 为 0.4, 在 各 盘 比赛 相互 独立 的 假设 下 
围 胜 、 乙 胜 和 不 分 胜 负 的 概率 各 为 多 少 ? 

解 :这 里 可 把 每 下 一 盘 棋 看 作 一 次 贝 努 里 试验 , 甲 赢 看 作成 功 , 则 成 功 概 
PH O0. 6 TX 为 10 盘 棋 赛 中 甲 赢 的 盘 数 , 则 和 一 56(10,0.6) 。 按 约定 , 甲 只 
ZA 6 盘 或 6 ALERTE., PA 
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POH) =P(X>6)= >| oo, 670. 4107 
类 似 地 分 析 ,有 
P( 不 分 胜 负 ) 一 PCX 一 5) 一 | e 0. 650. 45 


POLE) =P (X<4)= 2 | 10] 0. 60. 410-7 


完成 上 述 计 算 可 以 直接 计算 每 个 xz 对 应 的 概率 P(X==zx), 也 可 利用 附 表 1 给 
出 的 二 项 分 布 表 .。 该 表 对 z 为 非 负 整数 ,n 一 201)20,p 二 0.05(0,05)0, 95 给 出 
二 项 分 布 函 数值 


F= pop) a=0,1,*".,n 


k=0 


ES an , Y n=10,p=0.6 时 ,从 表 中 可 查 得 


4 
paso=23|0 


=0 


0. 6(1—p)*=0. 1662 


5 


P(x<5)= 2 | L0 0. 6*(1—p)"*=0, 3669 


利用 这 两 个 值 可 算得 
P(X=5)=P(X<5)—P(X<4) 
=0. 3669 —0. 1662=0. 2007 
P(X>26)=1-P(X<5) 
一 1 一 0. 3669=0. 6331 
由 此 我 们 得 到 结论 是 , 甲 胜 的 概率 为 0. 6331, 乙 胜 的 概率 为 0.1662, 甲 乙 之 间 
不 分 胜 负 的 概率 为 0. 2007, 可 见 二 项 分 布 表 可 帮助 我 们 迅速 无 误 地 完成 计 
算 ,我 们 应 尽量 利用 它 , 但 对 表 中 没有 列 出 的 值 仍 需 直 接 计 算 完 成 。 
例 2.2.10 某 厂 需要 12 只 集成 电路 装配 仪表 ,要 到 外 地 采购 。 已 知 该 型 
导 集 成 电路 的 不 合格 品 率 为 0. 1, 问 需要 采购 几 只 才能 以 99% 的 把 握 保证 其 
中 合格 的 集成 电路 不 少 于 12 只 ? 
解 : 设 n 为 采购 数量 ,XX, H n 块 集成 电路 中 不 合格 品 个 数 , 按 题 意 , 要 求 n 
—X,>12, 5 X,En—12, HE 


n—12 


P(X,<n—12)= Y 


下 一 站 


n k n—k 
» 9. 1 0.9 
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若 取 n= 二 15, 由 附 表 1 查 得 P(X <3) =0. 9444 ,尚未 达到 99% 的 把 握 . 再 对 
一 16 和 17 进行 类 似 查 表 计 算 ,得 

P(Xis4)=0.9830 

P(X11<5)=0. 9953 
可 见 , 需 采购 17 只 集成 电路 才能 以 99% 的 把 握 保 证 其 中 合格 的 集成 电路 不 
少 于 12 只 。 


2.2.4 ¡RNA 

ENS ETERNA IRA ATA, F 1837 年 由 法 国 数学 家 泊 松 
(Poisson S. D. 1781 一 1840) 首 次 提出 ,以 后 发 现 , 很 多 取 非 负 整 数 的 离散 随机 
变量 都 服从 油 松 分 布 , 这 里 仍 按 历 史 发 展 次 序 来 介绍 泊 松 公布 。 

在 二 项 分 布 b(n,p) 中 , 若 相 对 地 说 ,n 大 ,p 小 ,而 乘积 4 二 np 大 小 适中 
时 ,二 项 分 布 中 诸 概 率 有 一 个 很 好 的 近似 公式 。 这 就 是 著名 的 泊 松 定理 。 

定理 2.2. 1( 泊 松 定 理 ) 在 重 贝 努 里 试验 中 ,以 pe 表示 在 一 次 试验 中 
成 功 发 生 的 概率 。 且 随 着 增 大 ,p, EWN. Eno nnp, ACERO, 
则 出 现 工 次 成 功 的 概率 


n 
LE 
uE : 由 户 。 一 人 /7 , 可 得 
n + 。 n— E 

HEG Pa) 


= Dt | An 


T} n 


T n—r A? —A 
edo NTE (n—o0 ) 


对 固定 的 x 有 | 
limA,=A 
lim [14 ga 
—=00 nH 
HEES 
. n z — n- A 一 
lim| ”| p30 Pr) = ye à 
UEH T REM, 


由 于 油 松 定理 是 在 ap 一 4(z 一 ce) 条件 下 获得 的 , 故 在 使 用 中 要 求 ”大 ， 
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p 小 ;而 np 适中 ,此 时 有 如 下 近似 公式 


pi(1— par)" eT (2.2.7) 
H A WH npn 
Bj 2.2.11 在 500 人 组 成 的 团体 中 , 恰 有 个 人 的 生日 是 在 元 旦 的 概率 
是 多 少 ? 


解 : 在 该 团体 中 每 个 人 的 生日 恰好 在 元 旦 的 概率 为 p= 二 1/365, 则 该 困 体 
中 生日 为 元 旦 的 人 数 X~b(500,1/365), BN 


9991 0 
P(X=A)=| k ¡E ! 365 


k=0,]1,*,500 
这 个 概率 计算 是 复杂 的 ,但 为 了 比较 , 仍 对 有 =0,1,-…,6 进行 计算 ,然后 再 用 
近似 公式 (2. 2.7)? 计 算 ,其 中 一 500/365 王 1.3699。 两 者 结果 都 列 在 表 2. 2.3 
E. 
”从 表 2.2. 3 可 见 ,两 者 的 差别 都 在 第 四 位 小 数 上 才 显 示 出 来 ,其 近似 程度 
是 相当 好 的 。 


表 2.2.3 二 项 分 布 与 泊 松 近似 的 比较 


; | 500 | | | 1 一 | 500—4 Q. 3699)! 1.3500 
k 365 365 k! 

0 0. 2337 0. 2541 

] 0. 3484 0. 3481 

2 0. 2388 0. 2385 

3 0. 1089 0. 1089 

4 0. 0372 0.0373 

5 0. 0101 0. 0102 

6 0. 0023 0. 0023 
1 0. 0006 0. 0006 


ARA TAR ETE PIO TARA Me EE MEA r RERE 


的 , 且 其 和 恰好 为 1, 因 为 


r=0 


这 样 一 来 , 泪 松 概率 的 全 体 组 成 的 一 个 概率 分 布 , 称 为 泊 松 分 布 , 记 为 PA), 
知 随 机 变量 X 服从 泊 松 分 布 , 即 X 一 已 (4) ,这 意味 着 ,X 仅 取 0,1,2,… 等 一 


切 非 负 整数 , 且 取 这 些 值 的 概率 为 
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P(X=r)= Č 
ql 


+ 


其 中 参数 人 >0, 它 的 数学 期 望 容易 算得 ， 


e`’, a=0,1,. 


oP ar 
E(X)= 2/2 ° er 


Jer! 

这 表明 : 泊 松 分 布 P() 的 数学 期 望 就 是 参数 14， 

泊 松 分 布 是 锅 用 的 离散 分 布 之 一 ,现实 世界 中 有 很 多 随机 变量 都 可 直接 
用 泊 松 分 布 描述 ,它们 之 间 的 差别 表现 在 不 同 的 上. 下面 是 国内 外 文献 上 认 
可 的 服从 或 近似 服从 泊 松 分 布 的 随机 变量 的 一 些 例子 : 

(1) 在 一 定时 间 内 ,电话 总 站 接 错 电话 的 次 数 ; 

(2) 在 一 定时 间 内 ,在 超级 市 场 排 队 等 候 付 束 的 顾客 人 数 ; 

(3) 在 一 定时 间 内 ,来 到 车 站 等 候 公 共 汽 车 的 人 数 ， 

(4) 在 一 定时 间 内 , 某 操作 系统 发 生 故 障 的 次 数 ，; 

(5) 在 一 个 稳定 的 团体 内 , 活 到 100 岁 的 人 数 ，; 

COMA ERA; 

(17100 页 书 上 ,错别字 的 个 数 ，; 

(8) 一 个 面包 上 ,葡萄 干 的 个 数 。 

从 这 些 例子 可 以 看 出 , 泊 松 分 布 总 与 计数 过 程 相 关联 ,并 且 计 数 是 在 一 定 
时 间 内 、 或 一 定 区 域内 ,或 一 特定 单位 内 的 前 提 下 进行 的 。 下 面 我 们 详细 地 研 
究 第 1 个 例子 。 

例 2. 2. 12 ”一 项 研究 表明 :电话 总 站 一 天 内 接 鲁 电话 号 码 的 次 数 和 是 一 
-个 服从 泪 松 分 布 PO) 的 随机 变量 (简称 泊 松 变量 )。 对 某 电 话 总 站 连续 观察 
100 天 , 共 发 现 320 只 电话 接 错 号 码 , 具 体 数据 按 接 错 次 数 多 少 整 理 在 
K 2. 2. 4 的 前 两 列 上 .。 其 中 z 表示 一 天 内 接 错 次 数 n KREEK r 的 天 
妆 。 由 此 可 算得 接 错 次 数 为 z 的 频率 为 P* (x) 二 n./100, 它 放 在 第 3 列 上 ,最 
后 一 列 是 按 4 二 3. 2 算得 的 泊 松 概率 plr) =3. 2*e-32/zl。 比 较 表 上 的 最 后 两 
列 可 以 看 出 :这 组 汝 松 概率 p(x) 对 这 组 观察 频率 p* (zx) 的 拟 合 程度 是 很 好 的 
(在 统计 部 分 将 进一步 说 明 此 种 拟 合 程度 ) 。 

在 实际 中 ,人 们 常 把 在 一 次 试验 中 出 现 概率 很 小 (如 小 于 0. 05) 的 事件 称 
为 稀有 事件 。 由 二 项 分 布 的 泊 松 近似 可 以 得 到 .n 重 贝 努 里 试验 中 稀有 事件 出 
现 次 数 近 似 服 从 泊 松 分 布 。 下 面 的 例子 说 明 这 个 现象 。 


A 


— Àe 
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表 2.2.4 接 错 次 数 的 观察 频率 与 泊 松 概率 


接 错 次 数 观察 天 数 观察 频率 泊 松 概率 
r nz p*(x)=nm,/100 plr) =3. 2% *?/x1 
0 5 0. 05 0. 041 
l 12 0. 12 0. 130 
2 19 0. 19 0. 209 
3 24 0. 24 0. 223 
4 18 0. 18 0.178 
5 13 0. 13 0.114 
6 5 0. 05 0, 060 
T 2 0. 02 0. 028 
8 ] 0. 01 0.011 
9 l 0. 01 0. 004 
10 0 0. 00 0. 002 

100 1. 00 1.000 


91 2.2.13 为 保证 设备 正常 工作 ,需要 配 一 些 维修 工 , 若 各 台 设 备 发 生 
改 障 是 相互 独立 的 , 且 每 台 设 备 发 生 故 障 的 概率 都 是 0.01。 EB n 台 设 备 , 则 
n 台 设 备 中 同时 发 生 故 障 的 台数 服从 二 项 分 布 pln,0.01), 由 于 p= 二 0. 01 
很 小 , 故 “ 每 台 设 备 发 生 故 障 ” 可 看 作 稀 有 事件 , 故 和 又 可 近似 看 作 服 从 泊 松 
分 布 PCO), 其 中 A=np=nX0.01. 下 面 用 此 看 法 来 讨论 几 个 问题 。 

(1)P 右 用 一 名 维修 工 负 责 维 修 20 台 设 备 , 求 设备 发 生 故 障 而 不 能 及 时 
维修 的 概率 是 多 少 ? 

B Xi 为 20 台 设 备 中 同时 发 生 故 障 的 台数 , 则 X,~-b(20,0.01)。 由 于 稀 
有 事件 之 故 ,可 认为 X! P(N1), 其 中 义 =20X0.01 二 0,2, 这 里 符号 写 表 示 
“近似 服从 ”于 是 20 台 设 备 中 因 故 障 得 不 到 及 时 维修 只 在 同时 有 2 台 和 2 4 
以 上 发 生 故 障 时 才 会 出 现 。 故 所 求 概 率 


P(X 之 2)= 2, e e 02 


=1—e7 20, 26702 
=0. 0175 
这 表明 ,一 名 维修 工 负 责 维 修 20 台 设 备 时 , 因 同时 发 生 故 障 得 不 到 及 时 维修 
的 概率 不 到 0. 02。 
(2) 磊 用 三 名 维修 工 负 责 维修 80 台 设 备 , 求 设备 发 生 故 障 而 不 能 及 时 维 
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修 的 概率 是 多 少 ? 
设 X 为 80 台 设 备 中 同时 发 生 故 障 的 台数 , 则 X: 一 5(80,0. 01)。 类 似 地 
可 认为 ,ZX 4P), HH 4¿=80X0.01=0. 8, Pé 
510. 8 —0.8 — i 0.8% o.s 
P(Xs>4)= 2 Te =1- >, e 


上 述 概率 可 以 直接 算得 .这 里 可 查 泊 松 公布 表 获 得 , 附 表 2 对 z 为 非 负 整数 和 
1 一 0. 02(0. 02)0. 10(0. 05)1. 0(0. 1)2. 0(0. 2)8 (0. 5)15(1)25 给 出 泊 松 分 布 
AU. 


XT 


k 


FCD =P(XX1)= Dy La | 
如 A=0.8,1=3 时 ,可 查 得 


P(xs<3)= 2 5 
利用 这 个 值 可 算得 
P(x,>4)=1-—P(X,<3)=0. 009 
这 表明 ,三 名 维修 工人 负责 维修 80 台 设 备 时 , 因 同 时 发 生 故 障 得 不 到 及 时 维修 
的 概率 为 0.009, 几 平 为 前 面 的 0. 0175 的 一 半 ,提高 了 效率 。 
(3) 若 有 300 台 设 备 , 需 要 配 多 少 名 维修 工 , 才 能 使 得 不 到 及 时 维修 的 概 
率 不 超过 0.01, 
设 X, X 300 台 设 备 中 同时 发 生 故 障 的 台数 ,NN 为 所 需 配 的 维修 工 的 人 
数 , 类 似 地 可 认为 X;: PA) ,加 二 300X0.01 二 3。 于 是 应 满足 下 列 等 式 ， 


k 
; e ”一 0. 991 


PX>N+D= 27 e -3<0. 01 


2 Ze- 0. 99 
从 附 表 2 查 得 , 当 N=7H 8 时 ,有 


故 N=8 时 满足 要 求 , 即 要 用 i 8 名 维修 工 才能 人 300 台 设 备 得 不 到 及 时 维修 
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的 概率 不 超过 0. 01。 


x 2.2.5 超 几 何 分 布 
从 一 个 有 限 总 体 中 进行 不 放 回 抽样 常会 遇 到 超 几 何 分 布 。 
设 有 N 个 产品 组 成 的 总 体 , 其 中 含有 MM 个 不 合格 品 。 若 从 中 随机 不 放 回 
地 抽取 个 , 则 其 中 含有 不 合格 品 的 个 数 了 是 一 个 离散 随机 变量 。 假 如 x 过 
MMi X 可 能 取 0,1,…,z; 各 2>>M, 则 和 X 可 能 取 0,1,…，AM。. 由 古典 方法 容易 
44 (11,4 1. 6) 
2 
P(X=1)== NJ 


n 


01 (2.2.8) 
其 中 r=minín,M), 由 组 合 等 式 


z% 


可 以 看 出 ,上 述 概率 之 和 为 1, 即 和 P(X 一 zx) 一 1。 故 (2.2.8) 所 示 的 一 组 概率 
构成 一 个 概率 分 布 ,这 个 分 布 称 为 超 几何 分 布 , 它 含有 三 个 参数 N,AM 入, 记 
为 hn,N ,M), | | 

例 2.2.14 20 个 产品 中 有 5 个 不 合格 品 , 若 从 中 随机 取出 8 个 , 试 求 其 
中 不 合格 品 数 A 的 概率 分 布 。 

解 : 按 题 意 有 N=20, M=5,n 二 8。 由 (2. 2.8) 可 算得 


N 


n 


NM) 


n T 


Ñ 
== 8 6433 _ 
P(X=0) (20 =705979 =0- 0511 
8 
FLA 
ay AA 7) 32175 _ 
P(X=1) E 1959700: 2554 
8 
FLA 
—oy=14/16/_ 30050 _ 
P(X=2)= (25 =320970—0- 3973 
8 


70 


类 似 地 可 算得 X= 3,475 的 概率 , 现 都 罗列 于 下 


P 0.0511 0.2554 0.3973 0.2384 0.0542 0,0036 


这 就 是 六 的 分 布 。 由 此 分 布 可 算得 各 种 事件 的 概率 , 辟 如 ,不 合格 品 不 多 于 3 
个 的 概率 为 
PX<D)=P(X=0D+P(X=D+P(X=2+P(X=3) 
=0.0511+0. 2554 +0. 3973+0. 2384=0. 9424 
AB X AN, Msn) , 则 其 数学 期 望 为 


A NM) 
XT n TI 
EQO= Vr N 
n 
Mc [A 
_nM xa—1 n—x _nM 


NY [M1 N 
n— I | 

3 nn 过 之 N( 即 抽取 个 数 n 还 小 于 产品 总 数 NW) 时 ,每 次 抽取 后 ,总 体 中 的 不 合 

格 品 率 2 一 M/N 改变 其 微 ,这 时 不 放 回 抽样 ( 见 例 1.2.2) 可 近似 看 作 放 回 抽 

样 ( 见 例 1. 2.3) ,这 时 超 几 何 分 布 可 用 二 项 分 布 近似 ， 


$2.3 连续 随机 变量 


2.3.1 连续 随机 变量 的 概率 密度 函数 

连续 随机 变量 的 一 切 可 能 取 值 是 充满 某 个 区 间 (a,6), 在 这 个 区 间 内 有 无 
穷 不 可 数 个 实数 。 因 此 描述 连续 随机 变量 的 概率 分 布 不 能 再 用 分 布 列 形式 表 
示 ,而 要 改 用 概率 密度 函数 表示 。 下 面 结合 新 生 贾 儿 重 量 来 介绍 这 个 重要 概 
E. 

812.31 HERJER X 是 一 个 连续 随机 变量 。 假 设 称 重 时 的 记录 是 
以 市 斤 为 单位 作 近 似 表示 。 这 时 XX 可 能 取 3,4,5,… 等 值 . 这 些 值 之 间 的 间隔 
都 是 1, 记 为 Ar=1. 这 样 的 XX 可 近似 看 作 离散 随机 变量 ,可 用 图 2. 3. 1(ay 上 
的 概率 直方 图 近似 表示 美的 概率 分 布 , 其 中 每 个 矩形 面积 就 是 和 X 取 相应 值 的 

7 


o a e am r H 


概率 。 这 些 概 率 是 对 很 多 个 (如 ;十 万 个 ) 新 生 婴 儿 重 量 用 统计 方法 确定 的 ,从 
该 图 上 可 以 表示 : 

(1) 和 矩形 的 高 二 概率 P(X 二 zx)/ 和 矩形 的 宽 二 P/Azx。 这 意味 者 图 2.3.1(a) 
的 纵 坐 标 不 是 概率 已 ,而 是 P/Az。 即 区 间 长 度 为 Ar 上 的 平均 概率 ， 

(2) 所 有 和 矩形 面积 之 和 为 1。 

(3) 重 量 在 6 到 8 市 斤 的 概率 就 是 相应 6,7,8 的 三 个 矩形 面积 之 和 。 


P/Ax P/Ax: 


4 56 7 8 9 10 6 7 8 5 6 7 8 9 
(a) Ax =1 (b) Ax =0.1 (c) Ax— 0 


2.3.1 MERILE X 的 概率 分 布 


为 了 改善 上 述 的 近似 程度 , 现 假 设 称 重 时 的 记录 近似 到 0.1 市 斤 .这 时 XX 
可 能 取 3. 5,3.6,5.7,7.4,8.9 等 值 。 相 邻 值 之 间 的 间 隅 都 是 0. 1, 即 Ax = 
0. 1。 这 样 的 和 仍 可 近似 看 作 离散 随机 变量 ,其 概率 直方 图 ( 见 图 2. 3.1(Gb)) 是 
由 更 多 更 窜 的 矩形 相 联 而 成 ,其 顶部 要 比 (a) 图 光滑 一 些 。 每 个 窗 长 矩形 面积 
(概率 ) 仍 可 用 统计 方法 确定 。 同 样 从 图 上 可 看 出 : 

(1) 罕 长 矩形 的 高 = 已/Az , 仍 为 区 回 ( 长 度 为 Az 王 0.1) 上 的 平均 概率 E 
F Ar 缩小 了 10 倍 , 相 应 概率 可 能 缩小 10 倍 , 但 也 可 能 缩小 倍数 比 10 倍 多 或 
比 10 倍 少 ,这 表明 近似 程度 在 改善 ,向 精确 化 前 进 了 一 步 。 

(2) 所 有 窄 长 矩形 面积 之 和 为 ]。 

(3) 重 量 在 6 到 8 市 斤 的 概率 就 是 介 于 其 间 21 个 案 长 矩形 面积 之 和 。 

为 了 从 近似 走向 精确 ,我 们 让 Ar EX O. 01,0. 001,0, 0001,… 这 时 组 成 概 
率直 方 图 的 算 形 愈 来 愈 多 , 愈 来 愈 窗 , 它 的 顶端 愈 来 愈 光滑 ,但 上 述 三 个 特点 
仍然 保留 ,只 不 过 重量 界 于 6 到 8 市 斤 的 概率 要 用 更 多 更 窄 的 矩形 计算 ,结果 
就 更 为 精确 , 当 Ax->0 时 ,上 述 概率 直方 图 序列 就 趋向 于 一 条 曲线 。 若 用 户 (z) 
表示 这 条 曲线 ( 见 图 2. 3.1(c)), 则 pCz) 仍 有 如 下 特点 ， 

CDEC AATF z 轴 的 上 方 ,函数 值 pC(z) 不 是 概率 ,而 是 区 间 长 度 Azx 一 
0 时 平均 概率 P/Az 在 点 r 处 的 极限 值 ,这 是 一 种 特殊 密度 一 一 概率 密度 。 E 
表明 ;对 任意 两 点 zi 与 r210 pc) >plx:), M) X Æ z 附近 取 值 的 机 会 比 在 
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zs 附近 取 值 的 机 会 大 。 

(2) 曲 线 (z) 与 工 轴 所 夹 面积 为 1。 

(3) 重 量 界 于 6 到 8 市 斤 的 概率 是 该 曲线 pC(z) 界 于 6 到 8 之 间 的 曲 边 梯 
形 的 面积 ( 见 图 2. 3. 1(c)) ,这 可 用 定 积 分 表示 ， 


8 
PCOS T8) = | Pdz 


这 样 我 们 就 完成 了 从 近似 到 精确 的 过 渡 。 所 得 到 的 p(xz) 就 是 连续 随机 变 
EX 的 概率 分 布 。 它 可 用 来 精确 计算 有 关 X 的 一 切 事件 的 概率 ,这 样 的 函数 
plz) 将 称 为 概率 密度 函数 。 什 么 样 的 函数 可 以 称 为 概率 密度 函数 呢 ? 什么 样 
的 概率 密度 函数 可 用 来 描述 某 个 连续 随机 变量 X 的 概率 分 布 呢 ? 下 面 的 定义 
说 明了 这 两 个 问题 。 | 

定义 2.3.1 设 户 (z) 是 定义 在 整个 实数 轴 上 的 一 个 函数 ,假如 它 满 足 如 


FIRE: 
Mpa AEM) (2.3.1) 
(2) | podr 一 1 (p(z) 与 模 轴 所 夹 面积 为 1)》 (2. 3. 2) 


则 称 p (zx) 为 概率 密度 函数 ,或 密度 函数 ,有 时 还 简称 密度 。 

假如 密度 函数 p(xz) 与 连续 随机 变量 XX 有 如 下 关系 ， 

(3) 对 任意 两 个 实数 a 与 5, 其 中 4 过 5, 且 a 可 为 一 00,6 可 为 十 oo, 久 在 区 
间 [a,5] 上 取 值 的 概率 为 曲线 p(x) 在 该 区 间 上 曲 边 梯形 的 面积 , 即 


b 
Pla <X<b) = | 户 (ZJGT (2. 3. 3) 


则 称 密度 函数 p(z) 为 连续 随机 变量 XX 的 概率 分 布 ,或 简称 p(x) 为 X 的 密度 
ROTA Xp) REX 服从 密度 pa)”, 
下 面 绪 合 例子 来 叙述 连续 随机 变量 的 两 个 常用 分 布 : 均匀 分 布 与 指 FiO 
E 2. 3. 2( 均 匀 分 布 ) 某 办 事 员 处 理 一 份 护 照 申请 书 所 需 的 时 间 X 
位 :分 ) 是 一 个 连续 随机 变量 。 假 设 和 的 密度 函数 有 如 下 形式 
Cy 4 和 二 6 
0， 其 它 
这 表明 :该 办 事 员 在 处 理 一 份 护照 申请 书 至 少 需要 4 分 钟 ,最 多 需要 6 分 钟 ， 
由 于 p(X) 中 的 是 待定 常数 ,为 了 使 它 成 为 人 的 密度 函数 , 按 定义 2. 3.1, 必 
需要 
(1)p(z) 之 0, 在 这 里 要 求 c20, 


户 (Z) 一 


13 


(2) [pdz = 1 ,在 这 里 要 求 c(6 一 4) = 1, B| c = 0.5, 
当 c 用 0.5 代替 后 ,密度 函数 plz) 的 图 形 如 图 2. 3. 2 所 示 。 
P (x) P (x) P (x) 


0.5 


4 5 6 x 4 455 55 x 4 
(a) | (b) 


2.3.2 在 区 间 514,6] 上 的 均匀 分 布 


现 转 入 寻求 该 办 事 员 在 4 到 4.5 分 .5 到 5.5 分 .5 到 6 分 之 内 处 理 一 份 
申请 书 的 概率 。 这 些 概 率 就 是 图 2. 3. 2(b) 和 (c) 上 的 几 块 阴影 面积 。 由 于 它们 
EEK ,这 些 概率 很 容易 求 得 

PC(4SKX <4. 5)=0. 5(4. 5 一 4) 一 0. 25 
PO6<X<5. 5)=0. 5(5.5—5)=0. 25 
P(5<X=<36)=0. 5(6—5)=0. 5 

从 图 2.3.2(b) 上 可 以 看 出 , 底 边 相等 的 二 个 矩形 面积 总 是 相同 的 ,从 而 
X 在 这 两 个 小 区 间 上 取 值 的 机 会 是 相同 的 。 这 就 是 “均匀 ”的 含义 ,并 称 此 分 
布 为 均匀 分 布 .一般 地 ,在 有 限 区 间 [a,6] 上 为 常数 ,在 此 区 间 外 为 零 的 密度 函 
数 p(z) 都 称 为 均匀 分 布 , 并 记 为 U(a,5), 其 密度 函数 为 


ga a<z<6 
p(2)=30—a (2.3. 4) 
0, 其 它 

这 样 一 来 ,本 例 中 的 均匀 分 布 可 用 UVA ORR LA XU (4,6), BEE X JR 
从 区 间 [4,6j 上 的 均匀 分 布 。 

过 习 分 布 在 实际 中 和 常 使 用 , 臂 如 一 个 半径 为 的 汽车 轮胎 , 当 司 机 使 用 午 
车 时 ,轮胎 接触 地 面 的 点 要 受 很 大 的 力 , 并 借用 惯性 还 要 向 前 滑动 (不 是 滚动 ) 
一 段 距 离 , 故 这 点 会 有 磨损 。 假 如 把 轮子 的 圆周 标 以 从 0 到 2xr, 那 末 和 刹车 时 
接触 地 面 的 点 的 位 置 各 是 服从 区 间 [0,2zxr] 上 的 均匀 分 布 , 即 X—U(0,2rr) o 
因为 刹车 时 接触 地 面 的 点 在 轮子 的 那 一 个 位 置 上 可 能 性 更 大 一 些 是 说 不 出 
的 ,而 在 (0,2rr) 上 任 一 个 等 长 的 小 区 间 上 发 生 磨 损 的 可 能 性 是 相同 的 ,这 只 
要 看 一 看 报废 轮胎 的 四 周 磨损 量 几乎 是 相同 的 就 可 明白 均匀 分 布 的 含义 了 。 

例 2. 3. 3( 指 数 分 布 ) 用 如 下 指数 函数 表示 的 密度 函数 

74 


de, x=B0 
plr) 一 o, 20 (2.3.5) 
称 为 指数 分 布 , 记 为 Exp (4)。 其 中 4 是 根据 实际 背景 而 定 的 正 参数 。 假 如 某 连 续 
EIEE X Exp 0) MER X 仅 可 能 取 非 负 实数 。 实际 中 不 少 产 品 首次 发 生 故 
障 ( 需 要 维修 ) 的 时 间 服 从 指数 分 布 。 壁 如 , 某 种 热水器 首次 发 生 故 障 的 时 间 工 ( 单 
位 ;小 时 ) 服 从 指数 分 布 Exp (0. 002) , 即 T 的 密度 函数 (图 2. 3. 3) 为 
0. 002e "2." t0 


pco=| 0 ， <0 


P(X<100) 


P(300 < X<500) 
P(X >600) 


0 100 200 300 400 500 600 t 


2.33 指数 分 布 Exp(0. 002) 的 密度 曲线 


现 转 入 寻求 一 些 事件 的 概率 .在 上 述 假设 下 ,该 种 热水器 在 100 小 时 内 需 
要 维修 的 概率 是 多 少 ? 在 300 到 500 小 时 内 需要 维修 的 概率 是 多 少 ?在 600 小 
时 后 需要 维修 的 概率 是 多 少 ? 这 些 概率 分 别 是 图 2. 3. 3 上 三 块 阴 影 面 积 。 具 
体 计算 如 下 : 


100 100 
P(X < 100) = | bdr = f O. 00207 0-02 ¿y 
— 00 0 


— 人心 . — 0. 
— — ¿70002 0. 2 


100 1 
o e 


= 0.1813 
500 

P(300 < X < 500) = | O. 002e- dt 
300 


一 0. 002: | 00 _ 一 06 1.2 


= — e w0 E — e 


= 0. 1809 


P(X < 600) = | O. 002e7-002 gp 
600 


ano 


— 0, 0021 -1.2 


= e 
= 0. 3012 
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2.32 ”和 连续 随机 变量 的 分 布 函数 
按 分 布 范 数 定义 ( 见 定义 2.1.2), 连 续 随 机 变量 立 的 分 布 沙 数 F(zr) 可 以 
用 其 密度 函数 po) 表示 出 来 , 即 对 任意 实数 r, 


F= PX <a) = | pida (2. 3. 6) 


这 些 积 分 总 是 存在 的 ,其 中 有 些 可 以 积 出 来 ,用 初等 活 数 表示 ,有 的 积 不 出 来 ， 
只 能 用 积分 表示 ,或 用 特殊 国 数 表示 。 

例 2. 3. 4( 均 习 分 布 和 指数 分 布 的 分 布 函数 ) ”在 区 间 [a,6] 上 的 均匀 分 
布 的 密度 肾 数 p(x) 如 (2. 3.4) 式 所 示 。 再 利用 积分 (2. 3. 6) 式 不 难 获 得 均匀 
分 布 U (a,b) 的 分 布 函 数 


O, Ta 
Fla) =4 7,» 2<x<b (2.3.7) 
1, x >b 


在 进行 积分 时 要 分 三 段 进行 ,因为 p(x) 有 两 个 间断 点 , 生 分 三 段 表 示 的 ， 
图 2. 3.4 给 出 了 均匀 分 布 U(a,5) 的 plr) 与 F(zx), 从 图 上 可 网 ,这 里 的 F(z) 
时 分 三 段 表 示 ,但 接点 仍 头 尾 相 联 , 使 f(x) 是 一 个 连续 水 数 。 


P(x) 


a b X a b xX 
2.3.4 ”均匀 分 布 UCa,b) 的 密度 函数 p(x) 和 分 布 函数 F(x) 


指数 分 布 Exp(4) 的 分 布 范 数 亦 可 从 (2. 3. 6) AOR fE. 由 密度 函数 
(2. 3. 5), 分 两 段 积 分 , 即 可 得 
F(x) = >> Tel 
le, x>0 
图 2. 3. 5 288 TEBA Exp) plo 与 F(z) 的 图 形 。 从 图 上 看 ， p(z) 有 
一 个 间断 点 ,但 F(z) 仍 是 连续 函数 ， 
王 面 我 们 来 讨论 连续 随机 变量 分 布 函数 的 一 些 性 质 ， 
(1) 连续 随机 变量 X 的 分 布 函数 (zx) 是 直线 上 的 连续 函数 。 
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P(x) 


2.3.5 ”指数 分 布 Exp C24) 的 密度 函数 P(x) 和 分 布 函数 FG) 
证 :对 直线 上 任 一 点 及 其 一 个 增 量 Az ,分 布 函数 Fa) 的 增 量 为 
t+ åt 
AF = F(z Ar) — F(x) =f bladdx 


当 Ar 一 0 时 ,上 式 右 端的 积分 趋向 于 零 , 从 而 AF 一 0。 这 表明 F(x) 在 点 工 处 
HE HF REE REE HR MF) 是 直线 上 的 连续 函数 。 

这 个 性 质 与 我 们 在 例 2. 3.4 中 看 到 的 现象 一 致 ,连续 随机 变量 的 名 称 也 
由 此 而 得 。 

(2) 连续 随机 变量 站 仅 取 一 点 的 概率 为 零 , 即 P(X = x) = 0。 

证 ;对 直线 上 任 一 点 及 其 一 个 增 量 Az,X 仅 取 一 点 的 概率 可 表示 为 下 述 
概率 的 极限 : 

P(X = 7) = limP(1<X=<x + Az) 


T+ Ar 
=lim | pladr=0 
Azr—0 x 


在 概率 论 中 ,概率 为 零 的 事件 称 为 零 概率 事件 . 它 与 不 可 能 事件 % 还 是 有 
差别 的 ,不 可 能 事件 $ 是 零 概 率 事件 .但 零 概率 事件 不 全 是 不 可 能 事件 . 璧 如 
在 连续 随机 变量 中 ,事件 “X = r” 是 零 概率 事件 ,但 这 并 不 意味 着 事件 “X = 
xz” 是 不 可 能 事件 。 因 为 连续 随机 变量 取 任 何 一 点 都 是 有 可 能 发 生 的 ,同样 , 必 
然 事件 的 概率 为 1( 公 理 2) ,但 概率 为 1 的 事件 不 全 是 必然 事件 ,在 概率 论 中 
把 概率 为 1 的 事件 称 为 几乎 必然 发 生 的 事件 .认识 到 这 些 可 使 我 们 对 事件 与 
概率 的 认识 更 进一步 。 

由 性 质 (2) 立即 可 得 下 列 性 质 。 

(3) 对 连续 随机 变量 X 和 任意 实数 a 5 bla 二 5), 有 

Pl1E<X<b)=Pla<X<b) 
= Pla < Xb) = Pla <X <b) 

这 个 性 质 表明 ,在 计算 连续 随机 变量 X 有 关 事件 概率 时 ,增加 和 减少 一 
点 或 数 点 可 不 予以 计较 .这 对 以 后 概率 计算 和 事件 表示 带 来 方便 。 

17 


(4) 8 F) 和 pz) 分 别 是 连续 随机 变量 XX 的 分 布 函数 和 密度 函数 , 则 

在 f(x) FAMERS r EA 
F' (z) = plz) (2.3.8) 

证 :这 可 从 下 (zx) 的 积分 表达 式 (2. 3. 6) 看 出 。 

这 个 性 质 表明 ,对 连续 随机 变量 X 而 言 , 当 已 知 其 分 布 图 数 焉 (z) 时 ,用 
导数 可 求 得 其 密度 水 数 par), XI Fa) 导数 不 存在 的 那些 点 上 ,p(x) 可 任意 
给 定常 数 , 因 为 在 有 限 个 点 上 改变 密度 函数 值 不 会 影响 相应 分 布 函 数值 。 辟 
如 ,均匀 分 布 U(a,5) 的 分 布 函数 A(z)( 见 (2.3.7) 式 ) 在 点 a 和 点 6 处 是 不 可 
导 的 ,于 是 相应 的 密度 函数 p(x) = F'(z) 在 点 a 和 点 5 处 没有 定义 ,这 时 可 在 
已 a 和 点 6 处 对 plzx) 任意 给 定 两 个 常数 即 可 ,因为 X 取 这 两 点 的 概率 皆 为 零 ， 
不 会 影 啊 任何 事件 的 概率 计算 ,在 (2. 3.4) 式 中 给 出 p(z) 的 一 种 形式 ,也 可 
如 下 给 出 | 


mn =| a<Zr<b pio (50 a 之 Tb 
0 , HE 0 , HE 
EREA a 或 点 处 不 等 ,而 X 取 这 两 点 的 概率 皆 为 零 ,或 者 说 pila) A 
pra) 的 概率 为 0, 即 

Ptx:p,(x) 天 p: CT))} — P(X =a) + P(X =b) = 0 
KA p (0) = pz(z) 的 概率 为 1, 即 

Pix:pi(x) = p2(x)) = 1 

这 种 意义 下 的 两 个 函数 相等 在 概率 论 中 称 为 几乎 处 处 相等 ,以 示 区 别 微 积分 
中 的 两 个 函数 处 处 相等 ( 即 恒 等 ) 在 概率 论 中 ,几乎 处 处 相等 的 两 个 函数 之 间 
的 差别 可 忽略 不 计 , 从 而 可 以 相互 替代 。 这 种 忽略 零 概率 事件 正 是 概率 论 这 门 
学 科 的 特色 ,在 现实 世界 中 要 找到 两 件 完全 相同 的 东西 是 很 难 的 ,但 要 找 两 个 
几乎 处 处 相同 的 东西 就 容易 多 了 。 


2.33 ”随机 变量 函数 的 分 布 

在 理论 研究 和 实际 应 用 中 经 常会 遇 到 这 样 的 问题 :已 知 随机 变量 X 
率 分 布 , 要 求 其 某 个 函数 g(X) 的 概率 分 布 ,这 个 问题 在 离散 场合 较为 容易 处 
理 , 通 过 下 面 的 例子 就 可 说 明 清 楚 。 

例 2.3.5 i XENTER 6 个 值 的 离散 随机 变量 ,其 分 布 如 下 ， 

AR Y =2X 十 1, 则 Y 仍 是 离散 随机 变量 , 它 可 取 一 3, 一 1,1,3,5,7 等 6 
个 值 ,由 于 它们 没有 相同 的 , 故 Y 取 这 些 值 的 概率 仍 如 上 述 , 即 Y 的 概率 分 布 为 
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0.05 0.15 0.20 0.25 0.20 0.1o 


若 设 Z 二 X, Z 仍 是 离散 随机 变量 ,但 它 可 能 取 的 6 个 值 (4,1,0,1,4， 
9) 中 出 现 相 同 的 值 ,Z 取 相 同 值 的 概率 应 合并 起 来 ,如 P(Z = 1)= P(X=1) 
+ P(X =— 1) = 0.25 + 0.15 = 0.40, 这 样 我 们 可 得 2Z 的 分 布 如 下 : 


从 这 个 例子 可 以 看 出 ,在 离散 场合 求 随机 变量 函数 的 分 布 时 ,关键 是 把 新 
变量 取 相 同 值 的 概率 加 起 来 , 其它 保 持 对 应 关系 , 即 可 得 随机 变量 消 数 的 
分 布 。 

在 连续 场合 寻求 随机 变量 函数 了 = g(X) 的 分 布 虽 复 末 一些, 但 利用 分 
布 函数 及 其 性 质 , 按 一 定 步骤 也 是 容易 求 得 的 ,下 面 先 看 两 个 例子 。 

例 2.3.6 i X — Exp A) H a >0,3k Y = aX 的 概率 分 布 。 

解 : 由 于 和 是 连续 随机 变量 ,了 = aX 也 是 连续 随机 变量 。 如 今 已 知 关 服从 
参数 为 和 的 指数 分 布 , 其 分 布 范 数 与 密度 图 数 分 别 是 

Esta) = | e? pa = 7 
1—=e*, x2>0 do, x=>0 
HER Y = al 的 分 布 国 数 Fy(y) a BE PR pry), 为 此 分 下 面 几 步 
进行 。 

首先 讨论 了 的 可 能 取 值 .由 XX 不 可 能 取 人 负 什 , 故 Y 也 不 可 能 取 负 值 ,所 以 

我 们 有 / / 
Fy(y) =P Y<y=0, Y%Yy<XO 
其 次 对 y 0) MADARA ENHE HTA Fro), ZEF] a > 0, M8 
Fy(y) = P(Y <S y) = P (aX < y) 
= P(X < $) = Fx 
= ] — ee- 
综合 上 述 ,可 得 Y 的 分 布 函数 。 
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AAA A e A s " 


O, y 0 
] 一 ea“, y=0 


最 后 , 行 有 需要 ,可 对 Fro) E 


0, 
y< 0 
pry) = fa 


Fy(y) = | 


e t, y=0 


这 表明 , 当 X ~ Exp H,Y =aX(a > 0) ~ Exp(4/a)., 
B£12.3.7 RX -—UCO,D,KY =— nX 的 概率 分 布 。 
解 :从 例 2.3. 2 知 , 均 匀 分 布 U(0,1) 的 分 布 函 数 与 密度 函数 分 别 为 


O, rÚoO 
l, 0O<X<x<l 
F(x) = ALT» 0 <x<l px(X) = As 
O» HE 
l, xrl 


大 家 知道 ,X 仅 在 (0,1) 上 取 值 , 故 了 二 一 lnX 只 可 能 在 (0,ce) 上 取 值 .所 以 当 
y SORT, Frey) 二 0; 而 当 y > 0 时 ,我 们 有 
Fy(y) = PY <S y) = P(—InX< y) 
= P (nX >-— y) = P(X Èe”) 
=] — P(X <e”) = 1 — File >) 
=] ~e” 


综合 上 述 ,Y 的 分 布 函数 为 


FCy) = de y<0 
rd l-e”, y>o0 
对 其 求 导 , 立 即 得 了 MBA 
O, y<0 
briy) = q y>0 


可 见 , 当 X RAKE, D 上 的 均匀 分 布 时 ,了 = 一 lnX KRASA = 10 
指数 分 布 , 用 分 布 符号 表示 即 为 :车 XX ~ 上 U0,1), 则 Y = 一 nX ~ Exp), 
上 面 两 个 例子 对 寻求 随机 变量 函数 分 布 的 方法 是 有 启发 的 ,下 面 转 入 较 
为 一 般 情 形 的 讨论 。 
定理 2.3.1 设 已 知 随机 变量 和 的 分 布 函数 为 Fel) 和 密度 函数 为 
px) XRY = GOO, HPA OO) 是 严格 单调 函数 ,上 且 导数 g'(C,) 存在 ， 
则 Y 的 密度 函数 为 | 
pr(y) = px hy)) Ik Cy) | (2. 3. 9) 
其 中 hly) Æ y= ga) MERA O) 是 其 导数 。 
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证 :由 于 了 = 200) 是 严格 单调 图 数 ( 严 增 函 数 或 严 减 力 数 ), 故 其 反 郴 数 
X = hy) 和 存在 ,由 gg 可 叶 , 从 而 及 也 可 导 。 
为 确定 起 见 , 先 设 g(X) EX RRA, UA 
Fy = PY Sy) = PEX) y) 
= P(X <S hly) = Fx(h(y)) 
py(y) = px(h(y)) AR) (2. 3. 10) 
如 果 gX) 是 严 减 函数 , 则 事件 “ge(CX) S y” 等 价 于 “六 > ho)”, PRE E 
图 数 场 合 ,我 们 有 
Fy(y) = PO < y) = P(gO0 < y) 
= P(X 之 h(y)) = 1 — Fxi(hy)») 
pry) 一 一 px hly) +A y) (2. 3. 11) 
因为 当 g A IRR RT , HRR h MARA EA A y) < 0。 这 样 pro) 仍 
为 非 负 的 ,综合 (2. 3. 10) 和 (2. 3. 11) ,可 得 定理 的 结论 (2. 3. 9) 。 
应 用 定理 2. 3. 1 的 关键 在 于 写 出 反 函 数 , 找 出 反 函 数 后 , 立 凤 可 写 出 随机 
变量 函数 的 密度 函数 , 璧 如: 


4 Y 一 aX 十 bla AOM ERRAT) = (了 — b)/a,h' O) = L, FE 


Y 的 密度 函数 为 
pr(y) = OTO a 
24 Y =— InX H, RAR A(y) = e ?,h' (y) 一 一 e ”于 是 了 = — InX 的 
E ERA 
pr(y) = pxle De”? 
在 给 出 具体 的 pxl) 后 ,就 可 写 出 py(y) 的 表达 式 , 大 家 可 用 例 2.3.6 和 例 
2. 3.7 来 验证 这 些 结果 。 
02.3.8 设 随机 变量 XX 的 分 布 函 数 Fx(z) 是 严 增 函 数 , 则 Y = FX) 
服从 区 间 (0,1) 上 的 均匀 分 布 。 | 
为 了 证 明 这 个 结论 ,首先 要 看 到 Y = Rx(X) 是 在 区 间 (0,1) 上 取 值 的 随机 变 
量 , 所 以 当 y 夺 0 时 ,Fy(y) = 0; 当 yy 之 1 时 ,Fy(y) =1,M%0<y<1H,R 
们 有 
Fy(y) = PO < y) = P(Fx(X)< y) 
= px < FX Uy») 
= Fx(Fx'(y))=y 
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综合 上 述 ,Y = Fx(X) 的 分 布 谓 数 为 
0 yx o 
Poi 0< y<l 
1, y=1l 
这 就 是 在 区 间 (0,1) 上 的 均匀 分 布 函数 。 


2.3.4 连续 随机 变量 的 数学 期 望 

连续 随机 变量 的 数学 期 望 的 定义 和 含义 完全 类 似 于 离散 随机 变量 场合 ， 
只 要 在 离散 随机 变量 的 数学 期 望 定 义 ( 定 义 2. 2.2) 中 用 密度 函数 p(xz) 代替 
分 布 列 {p(x;)) ,用 积分 代替 和 式 , 就 可 把 数学 期 望 的 定义 从 离散 场合 推广 到 
连续 场合 。 

EX 2.32 设 连续 随机 变量 XX 有 和 密度 函数 p(x) ,如 果 积 分 


[六 zleczyaz (2.3.12) 
A RR , 则 称 
E(X) =|__aptoddz (2. 3.13) 
为 X 的 数学 期 望 ,简称 期 望 ,期 望 值 或 均值 .如 果 积 分 (2. 3. 12) AR, MUA X 
的 数学 期 望 不 存在 。 


连续 随机 变量 X 的 数学 期 望 E(X) 是 在 连续 场合 下 的 一 种 加 权 平 均 , 权 
EA AR RANA ARE MECO 表示 平均 重量 ;假如 六 表示 价格 , 则 
E(X) 表 示 平 均 价格 ;假如 关 表 示 寿 命 , 则 EE(X) 表示 平均 寿命 .从 分 布 观点 看 
效 学 期 望 , 则 数学 期 望 是 分 布 的 中 心 位 置 , 它 是 分 布 的 位 置 特征 ,假如 已 知 某 
分 布 的 数学 期 望 为 5, 则 该 分 布 大 约 在 5 附近 散布 着 。 

例 2. 3. 9( 均 匀 分 布 的 数学 期 望 ) ” 设 随 机 变量 X 服从 均匀 分 布 , 它 的 密 


RE RRO 
po (a ST b 
o. E 
它 的 数学 期 望 为 
E(X) = | zzczaz 一 E > da 
1 q? b b? — a* 
2 |a 2(b— a) 
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cs a re r Lirih $. 


可 见 ,均匀 分 布 的 数学 期 望 位 于 区 间 [La 0 的 中 点。 
例 2. 3. 10( 指 数 分 布 的 数学 期 望 ) 设 随 机 变量 服从 参数 为 4 的 指数 
分 布 , 它 的 密度 函数 如 (2. 3. 5) 式 所 示 。 它 的 数学 期 望 为 
E(X) = | _ apladda = | Are dz / 
利用 分 部 积分 法 ,可 得 
ECX) = | ear 一 一 ec | = 4 
可 见 , 指 数 分 布 的 数学 期 望 为 参数 4 的 倒数 , 壁 如 , 某 产品 的 寿命 (单位 :小 
时 ) 服从 参数 为 4 = 0. 002 的 指数 分 布 , 则 该 产品 的 平均 寿命 ET) = A? = 
(0. 002) = 500 小 时 。 
例 2.3.11 密度 函数 为 


pV TRIO 
的 分 布 称 为 柯 西 分 布 ,其 数学 期 望 不 存在 ,这 是 因为 积分 
1f™ £ 
> 1 十 zi 
无 限 。 
2.35 正 态 分 布 


连续 随机 变量 的 概率 分 布 简称 为 连续 分 布 .前 面 介绍 的 均匀 分 布 U Cab) 
和 指数 分 布 Exp(4) 就 是 两 个 常用 的 连续 分 布 . 下 面 将 介绍 另外 三 种 常用 的 概 
率 分 布 . 这 里 先 介 绍 正 态 分 布 . 下 面 分 几 点 叙述 。 

2. 3.5.1 ”定义 与 背景 

密度 函数 为 


(z— y? 
px) 一 y 


1 
Ta A 
的 分 布 称 为 正 态 分 布 , 其 分 布 函数 用 如 下 积分 表示 
-| az, 一 Co <T (2. 3. 15) 
它 省 有 了 两 个 参数 15 0; 一 局 过 yj 二 o, > 0 KRA Ns, AEX 
Mpa ) 表示 随机 变量 XX 服从 参数 为 1 与 a: 的 正 态 分 布 ,此 时 ,多 又 简称 正 态 
变量 ,plz) 图 形 又 简称 正 态 曲线 ( 见 图 2. 3. 6(a)) , 它 是 一 条 钟 形 曲 线 : 中 间 
高 .二 边 低 .左右 对 称 , 它 的 分 布 函数 图 形 ( 见 图 2. 3.6(b)) 是 在 (一 00,00) 上 
的 连续 上 升 曲 线 。 


一 co XxX o (2. 3. 14) 


Fx) 一 
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A aLi mg ae. O -E TE -= = ee eh r ara ea, aem a 


H x q 
(a) 正 态 密度 函数 (bd) 正 态 分 布 函 数 
图 2.3.6 正太 分 布 的 密度 函数 与 分 布 函 数 


由 于 正 态 曲线 p(x) BAT LEO APO 0。, 还 可 证 明 ;p(zx) 在 (一 
coyco) 上 的 面积 为 1, AA i = (x 一 y) jo, M 


= 一 co V2x 
右 令 了 为 上 式 右 边 的 广义 积分 , 则 其 平方 为 


P = i cdz| e /idy = | [ e ÉXxIDR A xd y 
利用 极 坐 标 变换 :z = rcosg,y = rsinó, W 
P = INN re” /drd0 = 2r IN re /dr = 2n 
0 


由 此 可 得 7T = /27, 代 回 原 式 即 说 明正 态 曲 线 确 是 密度 函数 ， 

2.3.5.2 正 态 分 布 的 背景 

正 态 分 布 在 概率 论 与 数理 统计 的 理论 与 应 用 中 都 是 最 重要 最 常用 的 分 
布 ,这 是 因为 

(1) 很 多 随机 现象 可 以 用 正 态 分 布 描述 或 近似 描述 , 璧 如: 

中 测量 误差 s 都 是 用 正 态 分 布 描述 的 ,测量 误差 se 是 随机 变量 ,时 大 时 小 、 
时 正 时 负 , 不 过 误差 大 的 机 会 少 ,误差 小 的 机 会 大 , 正 误差 与 负 误 差 出 现 的 机 
会 没有 理由 认为 是 不 等 的 ,这 些 现象 与 正 态 曲线 “中 加 高 两 边 低 左 右 对 称 ” 是 
完全 吻合 的 ,所 以 测量 误差 6 总 认为 是 正 态 变量 。 

扩 头 自动 包装 线 上 的 铅 头 重量 y 与 标准 重量 m 总 有 偏差 6, 此 种 6 也 和 
测量 误差 类 似 , 也 是 正 态 变 量 , 以 后 会 证 明 , 一 个 常量 与 一 个 正 态 变 量 之 和 y 
=m + ê 仍 是 正 态 变量 ,所 以 自动 包装 线 上 的 铅 头 重量 服从 正 态 分 布 。 

D 大 批 制 造 的 同一 产品 的 尺寸 :长 度 、 宽 度 , 高 度 、 直 名 等 分 别 都 是 服从 
正 态 分 布 的 随机 变量 。 

D 同龄 人 的 身高 与 体重 分 别 都 是 正 态 变量 。 

© 凡人 的 年 收入 可 近似 用 正 态 分 布 描述 ,因为 在 凡人 中 年 收入 特大 和 特 
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小 的 居 少 ,而 中 间 状 态 居多 。 

O 一 个 地 区 的 年 降雨 量 (单位 mm) 是 正 态 变量 。 

DO 超级 市 场 在 一 周 内 售 出 的 鸡蛋 重量 是 正 态 变量 。 

大 公司 职员 一 周 内 超时 津贴 是 正 态 变量 ， 

(2) 许多 分 布 可 用 正 态 分 布 作 近 似 计算 ,在 第 三 章 中 的 3. 5. 3 将 要 叙述 的 
二 项 分 布 的 正 态 近似 就 是 一 例 , 在 第 三 章 的 中 心 极限 定理 表明 ,在 一 定 条 件 
下 ,很 多 随机 变量 的 释 加 都 可 用 正 态 分 布 近似 。 

(3) 从 正 态 分 布 可 导出 一 些 有 用 分 布 ,如 统计 中 常用 的 三 大 分 布 : 洲 分 
ML IMF 分 布 都 是 从 正 态 分 布 导出 的 。 

可 以 说 ,概率 论 与 数理 统计 的 基础 部 分 就 是 以 正 态 分 布 为 中 心 建立 起 来 的 。 

2.5.3.3 正 态 分 布 的 数学 期 望 

EX ~ Na, MECO = p, 

WE: ECX) 的 积分 表达 式 中 作 变 换 z = (z 一 jx)/o, 可 得 


E(X) = | re fda 


00 


| (02 + we "dz 


1 
Son 
= -去 [of zer “d+ p er dz | 
由 于 上 式 右 端 第 一 个 积分 的 被 积 函 数 为 奇 函 数 , 故 其 积分 为 0, 第 二 个 积分 恰 
为 V2x, 故 得 ECX) = p, 

这 样 我 们 就 明确 了 正 态 分 布 Neu 中 的 第 一 个 参数 u 的 概率 含义 , 它 
就 是 数学 期 组 ,至 于 第 二 个 参数 a 将 在 下 一 节 介 绍 ,这 里 先 叙 述 其 名 称 和 概率 
含义 .a 称 为 标准 差 , 它 是 表示 正 态 分 布 在 其 期 望 值 x 附近 集中 与 分 散 的 程度 ， 
5 短小 ,分 布 愈 集中 , 正 态 曲 线 呈 高 而 瘦 ;o 愈 大 ,分 布 铺 分散, 正 态 曲线 呈 矮 而 
胖 , 详 见 图 2. 3.7, 由 此 可 见 , 正 态 分 布 由 其 期 望 值 y 和 标准 差 o 唯 一 确定 ,4 决 
定 其 位 置 ,o 决定 其 散布 大 小 。 


A=10, o =2.5 
A=40,0=5 
AH=80,0=10 
0 10 20 30 40 50 60 70 80 90 100 


E 2.37 三 种 正 术 曲线 
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2.5.3.4 ”标准 正 态 分 布 N (0,1 ) 及 其 分 布 困 数 表 : 

期 望 值 为 0 和 标准 差 为 1 的 正 态 分 布 N(0,1) 称 为 标准 正 态 分 布 ,相应 的 
随机 变量 叫 标准 正 态 变量 ,常用 U 表示 ,其 取 值 常用 表示 ,其 密度 函数 用 
pu) 表示 ,分布 国 数 用 Du) 表示 , 即 


] 1 
u) 一 “一 co Co .3,16 
$u) Tk Lu (2.3.16) 
1 u 2 
lu) = 一 一 “dx, — œ < u < 2.3.17 
(u) | <u< ( ) 
用 变量 替换 法 可 以 证 明 ;对 任意 实数 ,有 
Ow = 1 — Du) (2.3.18) 
此 绪论 亦 可 从 pu) 关于 纵 轴 对 称 中 直接 看 出 ( 见 图 2. 3. 8) 。 
$ (u) 


图 2.3.8 ©(— u) = 1 — O(u) 


”标准 正 态 分 布 函数 u) 是 正 态 分 布 计算 的 基础 .人们 对 Du) 编制 了 函 
数值 表 , 附 表 3 对 从 0 至 3.49 及 3.5,4,5,6 IET DaO 的 值 ,对 负 值 可 用 
(2. 3. 18) A15, 8U: 

D(1) 一 0.8413， 5(1.64) = 0. 9495 
(— 0.83) = 1 — (0.83) = 1 — 0. 7967 = 0. 2033 

反之 , 符 给 定 概 率 户 , 命 Du) = 请, 则 亦 可 从 附 表 中 查 得 相应 的 zx È, g 

如 , 命 Du) = 0.99, 可 从 附 表 3 FEB 
B(2.32) =0.9898,  D(2.33) = 0. 9901 

用 线性 内 插 法 可 得 DP. 327) =0. 99, 故 zx = 2.327, 

2.5.3.5 ” 正 态 变量 的 线性 变换 | 

利用 定理 2. 3. 1 可 知 , 当 XX ~ N) 时 ,U0 一 全 一 点 的 密度 函数 为 
1 
Jl 27 

XRH, 4 X ~ Nu, P) 时 ,U = (X 一 Am/ 是 标准 正 态 变量 , 即 U ~ 
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412 — bu) 


pulu) = pxu + du) +» o = 


N(0,1)。 

在 概率 论 中 ,把 随机 变量 和 X 减 去 自己 的 均值 kw, 再 除 以 自己 的 标准 老 c, 所 
得 到 新 变量 U = (X 一 Ap)/c 称 为 原 变量 和 的 标准 化 变换 ,或 简称 标准 化 .上 述 
计算 结果 表明 : 任 一 正 态 变量 经 过 标准 化 变换 后 都 是 标准 正 态 变量 。 血 如 在 
图 2.3.9 E,X,5 X 是 不 同 的 两 个 正 态 变量 ,但 经 过 各 自 的 标准 化 后 ,L = 


X, — X, — _ 
LL 与 U, 一 人 二 “都 是 标准 正 态 变量。 
X, ~N (2,0. 3*) 
N (0,1 
X ~N (10,2°) o 1) 
y, = A 10 U 
2 
8 10 14 -1 0 2 


2.3.9 ESSERE 


2.5.3.6 正 态 分 布 的 计算 
现在 转 入 正 态 分 布 的 计算 , 正 态 分 布 计算 主要 有 如 下 几 种 形式 。 
(1) 设 X~ N (1,0%) , Mi 


Fa < X <b) = p| E) — p| (2.3.19) 

HJE, a = 一 ce 或 = 十 co 时 ,有 
P(X <b) = o| 4] (2. 3. 20) 
PX>a=1-0 E (2. 3. 21) 


事实 上 ,由 X ~ No) 知 ,U = 个 二 上 是 标准 正 态 变量 , 故 
4 一 wk U< 4) 
o g 


Pla<ZX<b =P 
oo <tze) lost 
ot) efe 

O g 


2.3.12 设 X ~ N(0,2),X, ~ N(2,0.32)，, 试 求 下 列 概率 ,P(8 一 
X, <10,P(1.7<X,<2.6), 


解 :P(8 < XI 二 14) =P <u, <14 10) 
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HP ll re re LI 


= (2) 一 外 (一 1) 
= 0.9773 — (1 — 0.8413) 
= 0.8185 


1.7— 2 
0. 3 


= (2) — (— 1) = 0. 8185 
这 两 个 概率 相等 已 在 图 2.3.9 上 表示 出 来 。 
(2) 设 一 NG,o), 则 
P(|X Tal < ko) = PCR) — D(— R) 
= 20D(k) — 1 (2. 3.22) 
这 只 要 在 不 等 式 两 端 各 除 以 o 后 就 可 看 出 AAN k = 1,2,3 时 ,有 
0.6826y k= 1 
pox tn los k=2 (2. 3. 23) 
0.9974, k=3 
TA ESEE X 取 值 位 于 均值 e 附近 的 密集 程度 可 用 标准 差 o 为 单位 来 度 
量 . 图 2.3. 10 把 (2. 3. 23) 式 具体 表示 出 来 。 


PA1.7<X,<2.6)=P SU) LE 


M=30 H-20 Mo H M+og  M+20 H+30 
L— 68.3% — 


一 95.4% 一 一 一 -一 
L____ o 
99.7% 


2.3.10 ” 正 态 变量 在 均值 附近 取 值 的 概率 
(3) B X ~N, P) EM PXA <e) = p, Re, 
由 概率 方程 PCX < c) = p 可 得 @| 一 个) = p, Am 
= Gp) 


c = u + oP 1(p) (2. 3. 24) 
Hp D'r) iE D) AER, ETICO ERA EAM a) 
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存在 。 它 可 从 标准 正 态 分 布 消 数 表 ( 见 附 表 D 上 由 里 问 外 查 得 , 辟 如 
DB (0. 937) = 1. 53。 
(DRX ~ Nud), ERN PA — u| < co) =p ke, 
由 于 (2. 3.22) 可 得 ,2G(c) — 1 = p,@B(c) = (1 十 pp)/2, 故 
c = P (( + )/2) 
BEW p = 0.95,0. 99 8 0. 999 时 ,可 分 别 求 得 c 为 1.96,2.58 HI 3. 29, El 
| P(p-1.960 < X < u + 1.960) = 0. 95 
P(u-2. 580 < X < u + 2.580) = 0. 99 (2. 3. 25) 
P p-3. 290 < X < p + 3.290) = 0. 999 
这 些 结果 在 实际 中 是 有 用 的 。 
例 2.3.13 某 公 司职 员 每 周 的 超时 津贴 服从 正 态 分 布 ,其 均值 为 42.5 
元 ,标准 差 为 10.4 元 ,试问 每 周 超 时 津贴 超过 60 元 的 职工 在 全 公司 中 占 多 少 
比例 ? 
解 : 设 XX 是 该 公司 职工 每 周 的 超时 津贴 , 则 XX ~ N(42.5,10. 4?)。 所 求 的 
概率 为 | 
P(X > 60) =1 — P(X <60) 
60 — 42.5 
10. 4 


|= 1 — (1.68) 


= 1 — 0. 9535 = 0. 0465 

这 表明 ,每 周 得 60 元 超时 津贴 的 职工 占 全 公司 职工 的 4.65%, 

例 2.3.14 某 厂 生产 一 磅 的 铅 装 啤 啡 ,自动 包装 线 上 大 量 数据 表明 ,每 
铅 重 量 是 服从 标准 差 为 0. 1 磅 的 正 态 分 布 .为 了 使 每 钠 咽 啡 少 于 1 谤 的 镶 头 
不 多 于 10% ,应 把 自动 包装 线 控 制 的 均值 调节 到 什么 位 置 上 ? 

解 : 设 X 为 一 镶 的 咖啡 重量 , 则 XX ~ NG, 0.12) ,假如 把 自动 包装 线 的 均 
值 x 控制 在 1 磅 位 置 , 则 咖啡 少 于 1 磅 的 镶 头 要 占 全 部 向 头 的 50% BN PX 一 
1) = 0.5, 这 是 不 合 要 求 的 ( 见 图 2.3.11). 


2.3.11 ”自动 包装 线 的 均值 ,uw =1 图 2.3. 12 自动 包装 线 的 新 状态 
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为 了 使 每 镀 咖 啡 少 于 1 磅 的 钠 头 不 多 于 10% ,应 把 自动 包装 线 均值 4 调 
到 比 1 磅 大 一 些 的 地 方 ( 见 图 2. 3. 12) ,其 中 /必须 满足 概率 方 程式 P(X <1) 
= 0, 1。 对 正 态 变量 X 进行 标准 化 可 得 


oo 


由 此 可 得 
p=1+0.1 x 97'(0. 9) 
=]+0.1 X 1.28 = 1.128(6%) 

即 把 自动 包装 机 的 均值 调节 到 1.128 磅 的 位 置 上 才能 保证 获 啡 少 于 1 AR 
头 不 多 于 10%. 

”假如 购买 一 台新 的 包装 机 ,其 标准 差 为 0.025 磅 ,此 时 新 包装 机 的 均值 应 
再 市 的 位 置 是 

p=1+0.025 X 1.28 = 1. 032 i% 
这 PEY EA A ENE O. 096 磅 。 若 以 每 日 可 生产 2000 Ait, MI 

每 日 可 节省 192 磅 咖啡 。 若 每 磅 咖啡 的 成 本 价 是 50 元 , 则 工厂 每 日 可 获 利 
9600 元 ,者 新 的 包装 机 单价 是 10 万 元 , 则 第 11 天 开始 就 可 获 净 利 。 


2.36 1M0% 
C) MEAK, a AR a 的 积分 


F(a) = | eaz， a>0 
称 为 个 玛 函数 。 它 有 如 下 性 质 : 
DTU) = 1 n=, 
D MEDIA ¿Da 十 1) = ORAR. 特别 地 ,对 自然 数 
na + 1) =n1; 
ROS R). 
(2) 贫 玛 分 布 ,密度 函数 为 


A e=1¿— Az x 
píz) = ro ”7 (2. 3. 26) 
| 0, £ < 0 
的 概率 分 布 称 为 伽 玛 分 布 , 它 含有 二 个 正 参 数 a 与 4. 其 中 a > 0 称 为 形状 参 
B> RARER. E 2. 3. 13 画 出 了 若干 条 不 同 的 匣 玛 密度 函数 曲线 ， 
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从 图 上 可 见 ,e 盖 1 时 , 舍 玛 密度 函数 是 单 峰 , 峰 值 位 于 z = (a — 13/4331 < 
a 妇 2, 其 密度 函数 是 先 上 凸 AFA e > 2, 其 密度 是 先 下 廿 ,中间 上 上 凸 , 最 
ELFA. 

P (x) 


Pp (x) 


1<X<aXZ2 


2. 3.13 AM, A a 的 伽 玛 密度 函数 曲线 
伽 玛 分 布 记 为 Gala, O , 它 的 密度 函数 简写 为 


plr) = pege e, TX 这 0 (2. 3. 27) 


而 把 L = 0 的 部 分 略 去 ,以 后 都 是 这 样 去 理解 密度 函数 , 赂 去 的 部 分 均 为 零 。 

例 2.3.15 某 电 子 产 品 能 经 受 外 界 若 干 次 冲击 ,可 当 第 有 次 冲击 来 到 
时 ,产品 就 失效 了 ,这 样 ,该 产品 的 寿命 就 是 第 有 次 冲击 来 到 的 时 刻 , 假 如 在 
(0,0 时 间 内 ,产品 受到 的 冲击 次 数 X 服从 参数 为 由 的 泊 松 分 布 


PA -一 zr) = E emh, x = 0,],” 


则 该 产品 的 寿命 了 RAER k M a 03304 EN T ~ Gak, A). 

证 ; 设 该 产品 寿命 了 的 分 布 函数 为 FG) = PTS EPA T S” E 
未 产品 寿命 了 不 超过 时 间 t, BEREC, D 内 有 不 少 于 个 冲击 发 生 , 这 表明 ， 
事件 “了 过 如 与 事件 “和 k” AFE 


FO =PTL)=PA >k) Y 六 ex 
用 分 部 积分 法 可 以 验证 下 列 等 式 


4-1 x k E 
1—FU)= 2 Em | ade “dz (2. 3. 28) 
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由 此 可 得 


k-—1 e*dx 


FU) = O) SÍ 


这 表明 :T 一 Ga(& ,1)。 
上 述 由 泊 松 分 布 导出 伽 玛 分 布 ( 其 形状 参数 为 目 然 数 ) 具有 一 般 性 。 其 中 
(2. 3. 28) 也 表明 ,可 用 伽 玛 分 布 函 数 计 算 泪 松 分 布 , 这 个 关系 式 以 后 会 用 的 。 
(3) 伽 玛 分 布 的 数学 期 望 为 c/A, 利 用 匣 玛 函数 性 质 ,不 难 算得 
_ Fco +1) 1 a 


(4) 形 状 参数 a=1 HAN AGa O AVAE BA, ,其 密度 图 数 为 
户 (z) 一 Me 一， x>0 
指数 分 布 有 重要 应 用 , 某 些 电 子 元 器 件 的 寿命 .第 一 次 冲击 来 到 的 时 间 、 
电话 的 通话 时 间 .排队 等 候 服务 的 时 间 等 都 背 假 乍 服从 指数 分 布 。 由 于 它 只 含 
一 个 参数 ,计算 简单 ,实际 中 常 使 用 指数 分 布 来 描述 或 近似 描述 一 些 随机 变量 
的 概率 分 布 。 指 数 分 布 有 如 下 重要 性 质 ， 
定理 2.3.2 设 随机 变量 X—Exp O) , 则 对 任意 实数 s>0,>0 有 
P(X>s+t|X>s)=P(X>!) (2. 3. 29) 
完 说 明 此 定理 的 含义 ,然后 再 证 明 它 。 Bm X EER MIO. 3. 28) 式 
左 端 表明 ,大 已 知 寿 命 长 于 年 , 则 再 活 上 年 的 概率 与 已 活 年 龄 AR. 这 个 性 
质 称 为 “无 记忆 性 ”。 
定理 2. 3. 2 的 证 明 :容易 写 出 X SARR - 
F(x)=1—e x>0 
其 中 “z 委 0 时 下 (z) 王 02 省略 了 ,于 是 P(X>s)=e 天 。 对 任意 正 实 数 * He, 3 
(F X>+” REVIHE X>” RE, B 
“X >s+t”C X >s” 
于 是 条 件 概率 


P(X>st) ert? 
P(X>s)  e™ 


=e *23P(X>05 


PX>s+:1X>s)= 


这 就 证 明了 (2. 3. 29) 式 。 
(5) 尺 度 参数 4 一 方 ,形状 参数 "一半 Cn 常 为 自然 数 ) 的 伽 玛 分 布 
cal 如, 二] 称 为 自由 度 为 n 的 光 分 布 , 记 为 (x)。 REXEL UI 
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HA EX) =n, H AEX n 的 分 布 的 密度 函数 为 
a2 leZ, Xx>0 (2. 3. 30) 


1 
pix) ra ja 
X 分 布 是 统计 中 最 重要 的 三 大 分 布 之 一 ,统计 中 不 少 结论 与 此 分 布 有 关 , 它 
首先 是 由 英国 统计 学 家 玉 . 皮尔 逊 (1857 一 1936) 提 出 的 .自由 度 为 2 的 含义 
将 在 以 后 解释 。 


2.37 贝塔 分 布 
(1) 贝 塔 函 数 , 含 参 数 a 与 5 的 积分 


1 
Ba yb) = |a — x) dx, a>0, b>0 
0 


PADUA RA, EA FYER.: 
(DB(a,b)= Bp,a); 
所 贝塔 函数 与 伽 玛 函数 间 有 如 下 关系 


TCO OV) 
Bla, b) = 有 (ac 十 6) (2. 3. 31) 
证 :由 伽 玛 函数 定义 知 
Tar b) — [eye edad) 
0 JD 
作 变 量 蔡 换 z=xzoyy 一 zx(1 一 z) ,其 雅 可 比 行列 式 J = —u o A 
Mari = [Re — v) Ple ”""ududo 
0 
= errata — v) du 
= a + DBla,b) 
XA UEM TO. 
《2) 贝 塔 分 布 ,密度 函数 为 
pÈ) SETA ， 0<1<l (2. 3. 32) 


(在 其 它 工 处 上 (z) 一 0, 这 里 省 略 了 ) 的 概率 分 布 称 为 贝塔 分 布 , 记 为 Bela, 
Y ,其 中 < 与 5 都 是 形状 参数 , 且 都 为 正 。a 与 5 取 不 同 的 值 ,贝塔 密度 洲 数 形 
状 有 较 大 差异 。 图 2. 3.4 列 出 了 几 种 典型 的 贝塔 密度 函数 曲线 , 璧 如 , 当 a> 
1,0>1 时 ,p(xz) 是 单 峰 曲线 , 且 在 zi 二 (a 一 1)/(a 十 5 一 2) 处 达到 最 大 值 ; 当 a 
<1,0<1 时 ,p(z) 为 U ERR, HE r= (1 一 a)/(2 一 a 一 56) 处 达到 最 小 值 
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( 见 图 2.3.14(0)). Ma>1,0<1 时 , p(x) 为 形 曲 线 ; 当 a 二 1;65 宇 1 时 ， 
p(Xz) 为 反 J 形 有 曲线 ( 见 图 2. 3. 14(by) ) 。 


图 2. 3. 14 贝塔 密度 函数 图 形 


A MNAE ~Be(la,5), 则 XX 一 定 是 仅 在 [0,1j 上 取 值 的 随机 变量 ,不 
合格 品 率 、 机 器 的 维修 率 .打靶 的 命中 率 、 市 场 的 占有 率 等 各 种 比率 都 会 随时 
变化 的 ,选用 贝塔 分 布 作为 它们 的 概率 分 布 是 恰当 的 ,只 是 参数 a 与 不同 圈 
本 。 和 譬如 大 规模 集成 电路 的 成 品 率 不 很 稳定 , 它 有 150 道 工 序 ,从 原材料 到 工 
人 情绪 都 会 对 成 品质 量 产生 影响 ,但 全 是 不 合格 品 和 全 是 合格 品 都 极为 少见 ， 
此 时 用 as>1,2>1 的 贝塔 分 布 去 描述 它 是 妥当 的 。 又 如 股票 买卖 的 成 功率 为 
0 和 1 都 是 有 可 能 的 ,不 输 不 赢 的 股票 买卖 是 少见 的 ,这 时 用 a 过 1,5 二 1 的 由 
塔 分 布 去 描述 它 也 是 适当 的 。 

例 2.3.16 某 城 市 的 公路 分 成 很 多 段 , 设 在 一 年 中 需要 维修 的 公路 段 的 
比率 瑟 服 从 贝塔 分 布 Be(3,2) 。 要 求 在 任 一 年 中 有 一 半 以 上 的 公路 段 需 要 维 
修 的 概率 。 

解 :由 (2. 3. 32) 式 容易 写 出 贝塔 分 布 Be(3,2) 的 密度 函数 

pr)=127°(—r), 0<z<1 
而 所 要 求 的 概率 为 
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1 
P(X > +) -| 12x?(1 — zdzr = È = 0. 5625 
2 1/2 16 


(3) 贝 塔 分 布 的 数学 期 望 为 ca/(e 十 6) ,这 是 因为 
rla+ b) q 
六 (ca) (op) 
Ta 十 人 Tla+t DTG) 

“== Mara) Pa 十 5 十 了 

a 

= a+b 

(4)a 一 0 一 1 贝塔 分 布 Bed, DRETELJ] ERIE A , HE E R 

( 见 图 2. 3. 14(d)) 为 


E(X) = 


zt Y | _ aye” ldx 


fl, OKr1 
plr) 一 o. 其 它 
均匀 分 布 的 一 个 重要 性 质 是 : 设 随机 变量 X~ Be,1), W XERA Ar 的 小 
区 间 上 到 值 的 概率 等 于 Az, 而 与 区 间 的 二 个 端点 位 置 无 关 。 这 一 性 质 告诉 我 
们 , 当 已 知 一 个 随机 变量 仅 在 [0,1] 上 取 值 ,而 说 不 出 在 哪 一 个 小 区 间 上 取 值 


的 可 能 性 更 大 一 些 时 ,使 用 均匀 分 布 去 描述 它 是 较为 妥当 的 


$24 方 差 


方差 是 概率 分 布 ( 也 是 随机 变量 ) 的 最 重要 、 最 常用 的 特征 数 之 一 ,在 金融 
中 降低 风险 \ 在 生产 中 提高 产品 质量 、 在 测量 中 提高 精度 等 都 是 通过 减少 方差 
体现 出 来 的 。 这 里 将 从 随机 变量 函数 的 数学 期 望 开 始 先 给 出 数学 期 望 的 一 些 
运算 性 质 ,然后 转 到 方差 的 讨论 中 去 。 


2.4.1 随机 变量 函数 的 数学 期 望 

REIER X 的 分 布 函数 为 F(x), 在 离散 场合 可 用 分 布 列 {p ROMA 
FO ,在 连续 场合 可 用 密度 孙 数 pooR Fa). m X 的 数学 期 望 存在 , 则 

4 | 
2 tip (z) , 在 离散 场合 
E(X) 一 o (2.4.1) 

| zptoaz, .在 连续 场合 

这 征 已 为 大 家 玖 知 的 事实 ,就 是 用 X 的 分 布 计 算 X 的 数学 期 望 。 如 今 有 一 个 
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随机 变量 和 的 函数 g(X) ,假如 它 的 数学 期 望 存 在 ,如 何 计算 五 Lg(X)j 呢 ? + 
数学 期 望 定 义 (2. 4. 1) ,这 要 分 二 步 进行 : 
第 一 步 , 先 求 出 Y==g( 久 ) 的 分 布 {p (yi)) 或 p(y)。 
第 二 步 ,利用 Y 的 分 布 计算 EM =Elg 00). 
下 面 的 例子 将 说 明 这 个 过 程 。 
例 2.4.1 设 X 为 标准 正 态 变 量 , 即 X~ NOD HEREFPT X 的 数 
学 期 望 。 
BD) AR YX 的 分 布 。 由 于 函数 了 Y 王 X2: 在 整个 数 轴 上 不 是 严格 单 
调 函 数 , 故 不 能 直接 使 用 定理 2.3. 1 获得 了 的 分 布 , 还 得 从 Y 的 分 布 函数 是 
义 开 始 来 寻求 , 当 y 之 0 时 ,有 
Fy(y=P(Y<y=P(Xi<y) 
=P(YV y EXEV y ) 
=Fx(Y y) Fx y) 
EAR mAT y 求 导数 , 即 可 得 Y 的 密度 函数 
Fy(y)=[pxC(V y + px Y y 1/02 Y y) 
由 于 X 的 分 布 为 标准 正 态 分 布 AA ERKA 


轧 x(Z) 一 LL 


| ~ 27 
利用 这 个 密度 函数 ,容易 写 出 了 | 


1 
pr(y)= 一 一 2 ， y=0 


T s 
而 当 y<0 Rt, Fry) =0,) AM py(y) 二 0, 综 合 上 述 , 当 XX~N(0,1) 时 ,了 = 二 Xi 
的 分 布 为 伽 玛 分 布 Ga( 了 ,二 )。 
第 二 步 , 计 算 Y 的 数学 期 望 
EY) = | yprCy)dy 


a 
-= 
利用 变换 zx = ,72 ,可 把 上 述 积分 化 为 如 玛 肌 数 
2 3 
EY) =$ |, ute du = r| |=1 


A T 2 


y 20 dy 


MESA 1d) lr 1], 
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这 样 就 完成 计算 ,ECX’) 二 1, 这 是 一 种 算法 。 现 在 我 们 来 介绍 另 一 种 算 
(一 co ,co0) 上 的 定 积分 去 完成 , 即 
E(X?) 一 | _ zpxCz)dz 


l 


ii 2 
= 一 一 ate P da 


Van J- 
ERR PEIA A R E AR, ANA ARE, 049 
E(X?) = Fh ze’ dr 
利用 变换 x = zz/2, 可 把 上 述 积 分 简化 为 车 玛 函数 
2 、 2 ule- —_Ż2 pP 3|_ 
E(X) = |u Re—"du 二 Aaram 


两 种 算法 结果 相同 HA EMMA X X ~ px(x)， 
Y = g(X), 则 g(X) 的 数学 期 望 为 


E(g(X)) = [errar 


类 似 情 况 在 离散 场合 也 成 立 , 下 面 的 例子 说 明 这 一 点 。 
例 2.4.2 设 X 是 仅 取 5 个 值 的 随机 变量 ,其 分 布 为 


P p(—2) p(—1) p0) p) p2) 


则 g(X) 一 X 是 仅 取 3 个 值 的 随机 变量 ,其 分 布 为 


glX) 0 | 4 
P BO) ¿DEA pC—2)+p(2) 
于 是 按 数 学 期 望 定 义 , 可 得 
El g(X)]=0p0)+1[p(—1)+pa)]+4[pC— 24+ p e] 
=(—2)*p(—2)+(—1}p(—1)+0 p0) +1 p1)+2p(2) 
5 
= Y g(r) pz) 
i=] 


其 中 Zi 一 一 2 一 一 1 zs 一 0 7 一 1,z5 一 2。 可 见 用 X 的 分 布 与 用 g(X) 的 分 
MiA ELg(X)j] 的 结果 是 相同 的 。 
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ii a a a is ie 


从 上 面 两 个 例子 可 以 看 出 ,随机 变量 函数 的 数学 期 望 可 以 得 到 简化 ,下 面 
的 定理 保证 了 这 一 点 。 但 证 明 这 个 定理 需要 更 多 的 数学 工具 ,这 里 就 省 略 了 了， 
EH 2.4.1 设 随 机 变量 XX 及 其 函数 g(XX) 的 数学 期 望都 存在 , 则 有 
Y gl) la) , 在 离散 场合 


I 


El g(X)] = | (2.4.2) 


| epod 在 连续 场合 
其 中 {p(xzi)) 为 离散 随机 变量 的 分 布 列 ,p(zx) 为 连续 随机 变量 的 密度 函数 。 
利用 上 述 定 理 可 以 证 明 数 学 期 望 的 几 个 性 质 。 这 里 和 以 后 所 涉及 的 数学 
期 望都 假设 存在 ,不 再 一 一 说 明 。 
定理 2.4.2 设 g(X) 为 随机 变量 X 的 函数 ,c 为 常数 , 则 
Elcg(X)]=cEl|g(X) ] 
即 常数 可 移 到 数学 期 望 运 算 符号 外 面 来 。 
证 :分 两 种 情况 进行 。 首先 设 XX 为 离散 随机 变量 ,其 分 布 列 为 {p(x;)} ,由 
定理 2.4.14 


E| cg(X)] = > E ri) px) 
= cD 8 x) p(T) 


= El g(X) ] 
RR BX MESILLA, EFE BB po, HERE 2. 4. 1 知 


Elcg(X)] = | cgladplada 


= OO 
=cElg(X)] 
ER 2.43 设 g(X) MAX) 是 随机 变量 X 的 两 个 函数 , 则 
El[g(X) 士 站 (X)] = Elg00] + E[A00] 
上 式 对 更 多 个 函数 的 代数 和 仍 成 立 。 
证 :这 里 仅 对 X 为 离散 随机 变量 给 出 证 明 , 当 XX 为 连续 随机 变量 时 亦 可 
类 似 进行 。, 设 邓 的 分 布 列 为 {p(x;)}, 由 定理 2.4.1 知 
Elg(X) +A(X)] 
= Š lea) + h(x) px) 


= J gapa) + DADP) 
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= Elg(X)] + E[AC(X)] 

对 三 个 或 更 多 个 函数 的 代数 和 亦 可 类 似 进行 

定理 2.4.4 常数 c 的 数学 期 望 等 于 c, 即 E(c)=c。 

证 :常数 c 可 看 作 仅 取 一 个 值 的 随机 变量 ,这 个 随机 变量 拒 取 * 的 概率 为 
1 , 即 此 X 的 分 布 为 

P(X=c)= 
这 种 分 布 在 概率 论 中 称 为 退化 分 布 ,而 其 数学 期 望 
E(c)=c* 1=c 

例 2.4.3 设 X 服 从 参数 为 4 的 泊 松 分 布 PC), 在 § 2.2.4 中 已 求 得 E 
(X)=4, MRK DA. CR 

解 :根据 上 述 性 质 ， 

ECX—2) =El X*-—2A4X+2*] 
= E(X) —2AE(X) +} 

要 求 出 上 式 ,只 需 计算 ECX?) ,下 面 来 进行 计算 。 
A 
T! 


= A 


—A 
(a—1)1ó 


E(X’ = Za . 


- Dra DHI- 3 7:e 7" 


ED 
= Ae Y He Y A“ | 
=+ 


(1—1)! 
最 后 一 个 等 式 成 立 是 由 于 两 个 和 都 等 于 e:, 把 上 述 结果 和 ECO 一 人 代 回 原 
式 , 可 得 


Y 


E(X— A? =BH24— 24H 2=4 
PF TUAZAEl, AE A (AA? 的 数学 期 望 就 是 泊 松 分 布 的 方差 。 


2.4.2 方差 
数学 期 望 瑟 (X) 是 分 布 的 位 置 特征 数 , 它 总 位 于 分 布 的 中 心 ,随机 变量 Y 
的 取 值 总 在 其 周围 波动 .方差 是 度量 此 种 波动 大 小 的 最 重要 的 特征 数 , 下 面 来 
MEE. 
EP X—ECOAH ME, 那 此 种 偏差 可 大 可 小 、 可 正 可 负 ,. 为 了 使 此 种 偏差 
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能 积累 起 来 ,不 致 于 正 负 抵消 ,可 取 绝 对 偏差 的 均值 EX 一 E(X)| (又 称 平均 
绝对 差 ) 来 表征 随机 变量 取 值 的 波动 大 小 。 由 于 绝对 值 在 数学 上 处 理 不 其 方 
便 , 故 改 用 偏差 平方 [XX 一 EC(X) 下 来 消去 符号 ,然后 再 求 均 值得 ELX- 
ECX) 了 ,并 用 人 它 来 表征 随机 变量 取 值 的 波动 大 小 (或 到 值 分 散 程度 )。 为 了 使 
ELX—E(X)J FE, HER EX’ 存在 即 可 ,由 于 
IXI<X?+1, (Xa): 志 2CX? 二 a?) 

故 由 EX? 存在 可 推 得 (XX) 和 E[ 及 一 E(X)J 存在 。 

EX 2.4.1 设 随机 变量 XX 的 EX? 存在, 则 称 偏 差 平方 的 数学 期 望 EE[ 义 
一 E(X) 了 为 随机 变量 XX( 或 相应 分 布 ) 的 方差 , 记 为 

Var QO)=E[X—E0D 7? (2.4. 3) 

ARE RT Var(X) RAMENA X AB ADAC ox 
或 olX), 

下 面 将 以 离散 随机 变量 X 的 方差 为 例 来 说 明 方 差 的 统计 意义 。 设 义 的 分 
布 为 

P(X=zx)=p(r), i=1,2, 

则 按 定 义 2.4. 1 和 定理 2. 4.1 知 ,其 方差 为 


Var(X)= Jlr EX) Fpl) 

在 方差 Var(X) 较 小 , 则 和 式 中 每 个 乘积 项 都 要 很 小 。 这 必 导 致 如 下 情况 ; 

(DÍAZ xz; 一 E(X) 小 ,相应 概率 p(x;) 可 以 大 一 点 ， 

(2) 偏 差 x; 一 E(X) 大 ,相应 概率 p (zx) 必定 小 。 

这 表明 , 离 均 值 E(X) 愈 近 的 值 zx; 的 发 生 可 能 性 愈 大 ,而 远离 EC(X) 的 值 
zi 的 发 生 可 能 性 愈 小 ,此 种 随机 变量 在 EC(X) 附 近 取 值 的 可 能 性 很 大 , 故 其 取 
值 的 波动 就 不 会 很 大 。 反 之 ,车 方差 Var(X) 较 大 , 则 和 式 中 必 有 某 些 乘积 项 
较 大 .也 就 是 说 ,有 若干 个 大 偏差 x; 一 EC(X) 发 生 的 概率 较 大 , 即 有 较 大 概率 的 
值 x; 不 会 完全 落 在 EC(X) 的 附近 。 从 而 使 随机 变量 X 取 值 的 波动 就 会 较 大 ， 
对 连续 随机 变量 亦 可 作出 类 似 解释 .图 2.4.1 上 画 出 四 个 分 布 列 的 线条 图 , 根 
据 上 述 解 释 , 容 易 看 出 ,它们 的 均值 都 相同 ,而 方差 从 上 到 下 在 逐渐 减少 ,类 似 
地 ,在 图 2. 4. 2 上 画 出 四 个 密度 函数 图 形 ,它们 的 均值 也 都 相同 ,而 方差 从 上 
到 下 也 在 减少 。 

方 老 的 量 纲 是 随机 变量 闵 的 量 纲 的 平方 ,而 标准 差 000 =V Var OD H 
景 岗 与 XX 的 量 纲 就 相同 了 ,从 而 与 其 数学 期 望 (X) 的 量 纲 也 相间 ,这 样 一 
来 ,在 关 、EC(X) 和 ol(X) 间 进行 加 碱 运算 和 比较 大 小 就 有 实际 意义 了 .譬如 ,我 
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i 
(a) (e) 
} 


| 
| 
| 
| 
123456789 a E(x) b 


E(x) 
人 | 
(b) T 0 | 
(0) | (g) 
(h) 
(d) 
图 2.4.1 四 个 分 布 列 图 2.4. 2 四 个 密度 函数 
AÉ V >V >V, >V: HE VVV, > Vs 
们 今后 会 经 常 谈论 事件 | 
IX—ECX)|KXko(X), k=1,2,3,*" 
及 其 概率 


PC(E(KX)—ko(X)KXKE(X)+ko(X)) 
这 表明 ;随机 变量 X 落 在 区 间 [ECX) 一 ko (XX) ,EC(X) 十 ko(X)] 内 的 概率 ,这 
PREM ECX) 为 中 心 ,而 以 倍 标 准 差 为 半 和 名。 
例 2.4.4 某 人 有 一 笔 资 金 , 可 投入 两 个 项 目 : 房 地 产 和 开 商 店 , 其 收益 
都 与 市 场 状 态 有 关 。 若 把 未 来 市 场 划 分 为 好 中. 差 三 个 等 级 ,其 发 生 的 概率 分 
别 为 0.2、0.7、0.1, 通 过 调查 ,该 人 认为 购置 房地产 的 收益 和 (万 元 ?和 开 商 店 
的 收益 了 (万 元 ) 的 分 布 分 别 为 


请 问 : 该 人 资金 应 流 同 何方 为 好 ? 
解 :我 们 先 考察 数学 期 望 ( 即 平均 收益 ) 
E(X)=2.2 十 2.1 一 0. 3 二 4, 0( 万 元 ) 
E(Y)=1. 2 十 2.8 一 0. 1 一 3.9( 万 元 ) 
从 平均 收盘 看 ,购置 房地产 较为 有 利 ,平均 可 多 收益 0. 1 万 元 ,我 们 再 来 计算 
它们 各 目的 方差 
Var(X)=(11—4) X0. 2+ (3—4)*Xx0. 7+ (—3—4)?Xx0.1=15. 4 
Var (Y)= (6-3. 9x0. 2 十 (4 一 3. 9x0. 7+(—1—3. 9)?Xx0. 1=3. 29 
及 标准 卷 
a(xX)=V15.4=3.92, oa(7) 王 /3.29=1.81 
在 这 里 标准 差 (方差 也 一 样 ) 愈 大 ,收益 的 波动 就 大 ,从 而 风险 也 大 ,如 购置 房 
地 产 的 风险 要 比 开 商店 的 风险 高 过 一 倍 多 .前 后 权衡 ,该 投资 者 还 是 选择 开 商 
店 ,宁可 收益 少 一 点 ,也 要 回避 高 风险 。 
例 2. 4. 5 | 设 X-—N(rmoDRVardOoO. 
解 : 据 方差 定义 和 定理 2. 4. 1, 正 态 分 布 N(x,o?) 的 方差 为 
Var(X) = E(X — E(X)” 
= E(X — py? 
1 
~ 2 
作 标 准 化 变换 w = (xz 一 Ap/c, 可 得 
g? 
~ 2r 
o pe oo 
by 
最 后 一 个 等 式 成 立 是 由 于 被 积 函 数 为 偶 函 数 , 再 利用 变换 y = zx2/2 ,可 把 上 述 
定 积分 化 为 茹 玛 函 数 , 即 
| uredu 一 ~ 人/ 2 | stedy 一 SE TÍ 3) = Ya 
代 回 原 式 , 即 得 XX 的 方差 为 o?, 这 表明 , 正 态 分 布 N (py,o?) 中 的 第 二 个 参数 o 
ED Z, M 0 是 其 标准 差 , 它 的 大 小 表征 着 随机 变量 取 值 波动 的 大 小 。 


g | (x _ uye 01 qa 


Var(X) = 


oo 2 
| u'e" Pdu 


2 
2¿= du 


2.4.3 方差 的 性 质 
定理 2.4.5 常数 c ERRE Var(c)=0, 
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证 :由 于 常数 c 的 数学 期 望 仍 为 c, 故 其 方 老 
Var(c)=E(c—E(c))’=E(c—c)=0 
定理 2.4.6 对 任意 常数 a 与 和 随机 变量 和 ,有 
Var (aX +b) =a*Var(X) 
证 :由 数学 期 望 性 质 知 ElaX+b)=aE(X)+b, 
VarlaX+b=ElaX+b-ElaX+bD) ] 
=ElaX—aE(X) | 
=a E(X—EC(X))* 
=aVar(X) 
定理 2.4.7 随机 变量 X 的 方差 有 如 下 的 简便 计算 公式 
Var(X)=E(X)— [ECX) | (2. 4. 4) 
证 :由 数学 期 望 性 质 可 得 
Var(X)=E|X—EC(X) ]* 
=E[X?—2XEQGO+[E007] 
=E (X?)—2E(X)E(X)+[E(X) Y 
=E (X) —LE(X) ]* 
下 面 利 用 简便 公式 (2. 4. 4) 来 计算 一 些 常 用 分 布 的 方差 。 
例 2.4.6 二 项 分 布 bpln,p) 的 方差 为 np (1 一 p)。 
E: BR Xba, p) HRF ME EX =at, JABETZA, RARA 


E(X’): 


E(X?)= al "rap 


= -Ðra-|” E (1—-p) “十 Hal r pp)" 


=n(n—D)p" > n2) pap tng 
=n (n—l)p' +np =n p? +np 1 — p) 
由 此 可 得 和 的 方差 为 


Var(X)=E(X%)—E(X)'=np(1— p) 
例 2.4.7 均匀 分 布 Za,b) 的 方差 为 (5 一 <a)2712。 
解 : 设 XX~U(a,5) ,其 数学 期 望 在 区 间 (a,5) 的 中 点 , 芭 E OO =(a +0) / 
2。 为 计算 其 方差 , 先 计算 EOS. 
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b 2 
E(X?) -| dz 


d E 
bal, 
1.4 
 b=a 3 

= (0 + ab + a?) 


由 (2. 4. 4) 式 可 得 
Var(X) == +abta?)—- ato) 
- (b—a)y 
— 12 
可 见 , 均 匀 分 布 V(a,p) 的 方差 为 区 间 长 度 的 平方 除 以 12。 璧 如 均匀 分 布 
UO DIHITZEN 1/12, 
例 2.4.8 WEI Gale OITEÉN 2/2, 
W: it X~Gala, A) ,其 数学 期 望 天 (X)=a 为 计算 其 方差 ,我 们 先 计 算 
E(X’), 


L? e q! e e` “dr 


2y Æ 
EQO) = rla) | 
由 佑 玛 函 数 的 性 质 知 ,上 式 右 端的 积分 为 卫 (a 士 2) 。 代 回 上 式 , 即 得 
E(X?)=a(a+1)/4, MA M 


Var(X) = etb 


y 
A 
(Da=1 HAWES A Ga (1,4) 为 指数 分 布 Exp (4)， 所 以 当 Y —Exp(A) 
BJ) ECY) =A, Var(Y)=4 *,0(X)=A4 7, 


(2)a 一 > Cn 为 目 然 数 ) ,4 二 止 时 的 合 玛 分 布 为 卡 方 分 布 Xn)。 所 以 , 当 


Z~ 久 (nn) 时 ,EE(Z) 二 n,Var(Z)==2n, 要 记 住 : 卡 方 分 布 的 方差 是 其 期 望 的 二 
信 。 
例 2.4.9 RENEE X 的 数学 期 望 为 ,方差 为 o, 则 区 的 标准 化 随机 
PE X= (Xas 的 数学 期 望 为 0, 方差 为 1。 
解 :由 数学 期 望 和 方差 性 质 可 知 
E(X")>=ZELX—E(X)]=0 
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Var (XO=E(X 0D =E[X-E0OY'=1 


2.4.4 切 比 雪夫 不 等 式 

定理 2.4.8 ( 切 比 雪夫 不 等 式 ) 对 任 一 随机 变量 关 , 若 EX? 存在 , 则 对 任 
一 下 数 e, EH 
Var(X) 

e? 

先 说 明 这 个 概率 不 等 式 的 含义 ,然后 给 出 证 明 。 这 个 概率 不 等 式 对 连续 和 
离散 两 类 随机 变量 都 成 立 , 在 连续 随机 变量 场合 ,不 等 式 的 左 端 概率 是 密度 曲 
线 下 两 个 尾部 面积 之 和 ( 见 图 2. 4. 3(a))。 这 个 不 等 式 指 出 ,这 两 个 尾部 概率 
之 和 有 一 个 上 界 , 这 个 上 界 与 方差 Var(X) 成 正比 ,而 与 区 人 间 ( 瓦 (和 X) 一 e， 
E(X) 十 e) 的 长 度 的 一 半 的 平方 成 反比 ,对 离散 随机 变量 也 可 作 类 似 解释 
( 见 图 2. 4. 3(b))。 


POX-EXlz0S< (2.4.5) 


E -€ E(X) E(X )+E E(X)-€ EY) E(X)+e 
(a) P(f-EU)I 关 2= 两 尾部 面积 之 和 (b) PU-ED >= ARRE 


2.4.3 ME POUX~EW RE PHEN 


证 :这 里 仅 给 出 连续 随机 变量 情况 下 的 证 明 ,离散 随机 变量 情况 的 证 明 亦 
可 类 似 进行 。 设 p(xz) 为 连续 随机 变量 的 密度 函数 , 则 有 


P(|X — EX| > e) = | pda 
lr—EX|=e€ 
在 此 积分 区 域 上 , 恒 有 (z 一 EX)?/e > 1 ¿UE LE RAR OA 
1 
E? 
|r—EX|>e€ ja—EXjze 


最 后 ,再 把 上 式 右 端 积 分 限 扩大 到 整个 数 轴 上 , 则 有 
PUX-EX|>e)< 去 | a — EXYp(a dx = 
在 切 比 雪 夫 不 等 式 中 方差 是 起 决定 作用 的 ,车 方差 VarCX) 较 大 ,分 布 就 


较为 分 散 ,于 是 两 尾部 概率 可 能 会 大 一 些 ; 若 方差 Var(X) 较 小 ,分 布 就 较为 
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pladx X | (x — EXYpiada 


Var(X) 
e? 


集中 ,于 是 两 尾部 概率 可 能 会 小 一 些 . 但 都 不 会 超过 Var(X)/e: 。 直 观 地 说 ,两 
尾部 概率 之 和 被 其 方差 所 控制 。 

E RA k EWR, E es 一 Ac(CX), 则 切 比 雪夫 不 等 式 可 以 改写 为 另 
一 种 常用 形式 : 


POX—E(X) >< (2.4. 6) 
HN AFA 


PEGO —ko(O<X<ECO Tho XN) >1 2 


pz 
壁 如 ,二 3 时 ,我 们 可 以 说 ,对 任 一 个 方差 存在 的 分 布 来 说 ,在 区 间 (E(X) 一 
30( 久 ) ,EC(X) 十 3oc( 久 ) ) 外 的 概率 不 超过 1/9, 而 在 此 区 间 内 部 的 概率 不 会 小 
F 8/9=0. 89. 

例 2.4.10 星期 六 :上 午 来 到 小 客车 陈列 室 的 顾客 人 数 XA 个 随机 变 
量 , 其 分 布 未 知 , 但 知 其 期 望 y= 二 18(C 人 ), 标 准 差 vc 一 2.5( 人 )，, 试 问 和 在 8 到 
28 人 之 间 的 概率 是 多 少 ? 

解 : 由 于 分 布 未 知 ,无 法 精确 求 出 概率 P8<X<28). 现 可 用 切 比 雪夫 不 
等 式 大 约 估 计 这 个 概率 ,由 于 E(X) 二 /==18。 

P(8<X<28)=P(—10<X—E(X)<10) 
=P(|X—E(X)|<10) 
考虑 到 标准 差 c==2.5, 所 以 上 式 又 可 写 为 
P(8<X<28)=P(|X—E(X)|<40) 


利用 (2.4.7) 式 可 得 上 述 概 率 不 会 小 于 1 一 五 一 也， Bp 


(2.4.7) 


P(8<X<28)> = 0. 94 


有 前面 曾 证 明 ; 常 数 的 方差 为 零 , 现 在 来 讨论 其 道 命题 。 

定理 2. 4.9 方差 为 零 的 随机 变量 X 必 几 乎 处 处 为 常数 。 这 个 常数 就 是 
其 期 望 E(XX) ,这 个 定理 亦 可 表示 为 : 若 Var(X)=0, 0] PCX=E(X))=1。 

uE: :由 切 比 雪夫 不 等 式 可 知 ， 对 任意 e 之 0, 有 


P(X—ECX) Sos 一 0 


故 有 P(XX 一 E(X) | 之 e) 王 0, 或 者 说 ,对 任意 e 汪 0, 有 
P(|X—EC(X)|<e)=1 
由 于 的 任意 性 ,上 式 必 导致 
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P(X=E(X))=1 
这 个 定理 表明 ,在 方差 为 零 的 情况 下 ,除去 一 个 零 概率 事件 外 ,X 就 是 仅 
取 已 (X) 一 个 值 的 随机 变量 。 在 这 里 ,方差 又 起 者 决定 性 的 作用 。 


2.4.5 ” 贝 努 里 大 数 定律 

在 第 一 章 曾 列举 一 些 例 子 (LA 1.2. 4) 说 明 . 可 用 事件 A 发 生 的 频率 
去 估计 事件 4 的 概率 。 因 为 随 着 独立 重复 试验 次 数 不断 增加 , 频率 将 稳定 
于 概率 。 这 里 的 “稳定 ”是 什么 含义 呢 ? 下 面 的 大 数 定律 把 稳定 性 说 清 
ÆT. 

定理 2. 4. 10( 贝 努 里 大 数 定 律 ) B X, 是 2 重 贝 努 里 试验 中 事件 4 发 生 
的 次 数 , 又 设 事件 4 发 生 的 概率 P(4)==p, 则 对 任意 的 e 之 0, 有 


>e! 一 0 (2.4.8) 


XA, 
lin P| | n Ê 


WE: En EZERRE P X, 服从 二 项 分 布 b(n,p) ,其 数学 期 望 与 方差 分 
别 为 E(X,) 二 np,，Var(X,) 二 np(1 一 p)。 MX /n En 重 贝 努 里 试验 中 ARE 
的 频率 ,其 数学 期 望 与 方差 分 别 为 


Et =p, Var ža) BU- E) 
n n n 
由 切 比 雪夫 不 等 式 可 得 
P| Ep re E 2039 (2.4.9) 
n E ne 


对 任意 给 定 的 se 盖 0, 上 式 右 端 将 随 着 mn 一 oo 而 趋向 于 零 , 再 考虑 到 概率 的 非 负 
性 ,本 得 (2.4. 8), 这 就 证 明了 贝 努 里 大 数 定律 。 | 

册 努 里 大 数 定 律 说 明 : 事 件 4 发 生 的 频率 X, /n 与 其 概率 p 有 较 大 偏差 
(譬如 大 于 事先 给 定 的 e) 的 可 能 性 愈 来 愈 小 ,但 这 并 不 意味 较 大 偏差 永远 就 
不 再 发 生 了 ,只 是 说 小 偏差 发 生 的 概率 大 ,而 大 偏差 发 生 的 概率 小 ,小 到 可 以 
名 略 不 计 , 这 就 是 频率 稳定 于 概率 的 含义 ,下 面 的 例子 可 以 帮助 我 们 从 数量 上 
来 理解 贝 努 里 大 数 定律 的 含义 。 

例 2.4.11 大 家 知道 ,一 枚 均匀 硬币 的 正面 (事件 4) 出 现 的 概率 为 0. 5. 
春 把 这 枚 硬币 连 抛 10 次 或 20 次 , 则 正面 出 现 的 频率 XX,/n 与 0.5 的 偏差 有 时 
会 大 一 些 , 有 时 会 小 一 些 , 总 之 不 能 保证 大 偏差 发 生 的 概率 一 定 很 小 。 可 是 当 
连 抛 105 次 时 ,出 现 大 偏差 (两 尾部 ) 的 概率 一 定 会 很 小 ,这 可 从 上 述 定理 证 明 
中 的 (2. 4. 9) 式 看 出 ERRE s 一 0. 01, 则 从 (2. 4. 9) 可 得 
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当 a=10 时 ,上 式 右 端的 概率 为 1/40 二 0. 025 ,这 说 明 : 连 抛 10 万 次 时 ,频率 
与 概率 之 间 的 偏差 超过 0. 01 的 机 会 不 会 超过 2.5% ,同样 地 , 右 连 抛 100 万 
次 ,频率 与 概率 之 间 的 偏差 超过 0. 01 的 机 会 不 会 超过 1/400=0. 0025 = 
0. 25% ,可 见 试验 次 数 僵 多 ,此 种 偏差 出 现 的 可 能 性 愈 小 .但 偏差 超过 0. 01 的 
机 会 还 是 存在 的 。 由 于 这 种 机 会 很 小 ,以 致 于 不 会 影响 人 们 决策 。 当 人 们 对 一 
个 问题 作 决 策 时 ,犯错 误 的 概率 为 1/400, 而 正确 决策 的 概率 为 399/400。 这 项 
决策 是 可 以 下 决心 了 ,概率 论 与 数理 统计 中 所 有 决策 ,几乎 全 是 在 这 种 概率 意 
义 下 作出 的 。 


$2.5 随机 变量 的 其 它 特 征 数 


数学 期 望 ( 均 值 ) 与 方差 是 随机 变量 (也 是 其 分 布 ) 最 重要 的 两 个 特征 数 ， 
此 外 ,随机 变量 还 有 一 些 特征 数 ,如 原点 矩 . 中 心 矩 .变异 系数 、 偏 度 、 峰 度 、 分 
位 数 . 众 数 等 。 下 面 逐一 介绍 它们 。 

随机 变量 的 每 一 个 特征 数 都 可 由 其 分 布 算得 (假如 存在 的 话 ) ,并 从 一 个 
侧面 刻 划分 布 的 一 个 特征 .在 实际 应 用 中 ,一 个 分 布 只 须 用 几 个 特征 就 可 勾 划 
出 其 大 概 ,不 需要 算 其 所 有 特征 数 ,至 于 选用 那 几 个 特征 数 , 那 要 看 具体 分 布 
而 定 。 如 正 态 分 布 只 须 用 其 均值 与 方差 两 个 特征 数 就 够 了 ， 


2.5.1 35 

EX 2.51 设 X 为 随机 变量 ,c 为 常数 ,k 为 正 整数 , 则 量 EXA 
如 它 存 在 ) 称 为 于 分 布 关 于 ec 的 大 阶 矩 . 若 <=0, 则 量 巨 2 BA XX DADA i 
OURAN pus c=EX, ME EC(X 一 EX)* 称 为 革 分 布 的 上 k 阶 中 心 条 ， 
WA vro | 

容易 看 出 ,一 阶 原点 矩 就 是 数学 期 望 ,二 阶 中 心 矩 就 是 方差 。 在 实际 中 党 
用 低 阶 矩 ,高 于 四 阶 矩 极 少 使 用 。 由 于 | 久 | 生 :所 |X1* 十 1, 故 阶 矩 存在 时 ,一 
1 阶 征 也 存在 ,从 而 低 于 上 的 各 阶 矩 都 存在 。 

中 心 逢 与 原点 矩 之 间 有 一 个 简单 关系 ,事实 上 


k 
n=E(X—EXV=E(X — m) = 2 | | pt ay 


108 


TFT ' om 


故 前 四 阶 中 心 矩 可 分 别 用 原点 卸 表 示 
y =0 
Vz = Mo — pÀ 
Y3 = y3 — 3 2 + 24 
M == 4 — 4 H3 pa 十 6 yop 一 3Hi 
例 2 5.1 设 随机 变量 X~NC,o), 试 求 其 各 阶 中 心算 。 
解 :的 * 阶 中 心 矩 为 


1 | y QÝ 
= (ax — pe. 2» da 
Å FT _ 2 | 
o ff a 2/2 
一 一 一 一 ue * “du 
N 2X e 


在 k ATAT , EERE AAA A i 内 一 0 一 1 3 5 


yi = 4 | al ute “du 
0 
一 N Ep 2 | 2T edz 
n 0 
=| 20 27+ 1 
x 2 
= 0 (k — 1) (k — 3)""1, k= 2,4,6, 


DUES A A AI I N PLEA 
vu =0, n=”, n= 0, n = 30 


2.5.2 变 导 系数 
定义 2.5.2 设 随 机 变量 X 的 二 阶 和 矩 存 在 , 则 比值 


称 为 和 分 布 的 变异 系数 。 

容易 看 出 ,变异 系数 是 以 其 数学 期 望 为 单位 去 度量 随机 变量 取信 波动 
度 的 特征 数 。 它 是 一 个 无 单位 的 量 ,一 般 说 来 , 取 值 校 大 的 随机 变量 的 方差 与 
标准 差 也 较 大 ,这 时 仅 看 方差 大 小 就 不 合理 。 壁 如 北京 与 上 海 距 离 是 一 个 常 
最 ,可 其 测量 值 X 是 随机 变量 。 若 设 其 均值 EX=1463 公里 二 1463000 AR, 
标准 差 o(X) 二 500 公 尺 , 则 其 变异 系数 C.= 0. 00034。 而 测量 100 公 尺 跑道 ， 
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若 设 EY=100 公 尺 ,ao(Y) 一 0. 05 AR =5 厘米 , 则 其 变异 系数 C, 二 0. 0005, 
相 比 之 下 ,还 是 测量 北京 至 上 海 的 距离 较为 精确 ,因为 其 变异 系数 较 小 。 


x2.5.3 偏 度 

定义 2.5.3 设 随 机 变量 XX 的 三 阶 窍 存在 , 则 比值 

ys E(X— EX)? 
AG PE IEX-EX TO 
FAX ATAR A O) PR EE. 

前 面 告 之 , 正 态 分 布 的 三 阶 中 心 逢 v= 二 0, 故 其 偏 度 B= 二 0, 一 般 , 若 概率 密 
ERAR p(xzx) 关 于 数学 期 望 EX 对 称 , 即 有 pCEX 一 zx)= 二 pCEX 十 zx), 则 其 三 阶 
PARE n 必 为 0, 从 而 B= 二 0, 这 表明 ;关于 EX 对 称 的 概率 分 布 ,其 偏 度 为 零 
( 见 图 2.5.1(b))。 硅 偏 度 Bi 不 为 零 , 则 其 分 布 不 是 对 称 的 , 且 |B| 愈 大 ,其 分 
布 与 对 称 分 布 偏离 愈 大 ,特别 ,车 PP >0, 则 其 概率 分 布 为 正 偏 或 左 偏 ( 见 图 
2. 5. 1(a)); E Bi 二 0, 则 其 概率 分 布 为 负 偏 或 右 偏 ( 见 图 2.5. 1(c))。 定义 
2. 5.3 中 以 除 以 (vo) 是 为 消除 量 纲 的 影响 ,使 其 更 具有 可 比 性 。 

例 2.s.2 EX EY 为 二 个 离散 随机 变量 ,它们 的 分 布 分 别 如 下 表 所 
示 。 从 它们 各 上 自 线 条 图 ( 见 图 2.5. 2 与 图 2.5.3) 上 看 ,X 的 分 布 是 左 偏 的 ,Y 
的 分 布 是 右 偏 的 ,现在 来 计算 它们 的 偏 度 。 


P (x) P (x) p( x) 


(a) B,>0 (b) B,=0 (6) p<0 
2.5.1 三 种 不 同 偏 度 的 分 布 


B,>0 p, <0 


1 2 3 4 5 
HW 2.5.2 XA 图 2.5.3 7 的 分 布 


110 


x 2. 5. 4 MEE | | 
EX 2.5.4 设 随机 变量 XX 的 四 阶 矩 存在 , 则 比值 减 去 3 


p=%-—3- E(X—EX) _3 
2 [E(X—EX)] 


称 为 X 分布 的 峰 度 系数 ,简称 峰 度 。 

前 面 告 之 , 正 态 分 布 Nmp,o2) 的 岂 一 到 ,wm 一 3o 故 按 上 述 定 义 可 知 B= 
0, 这 意味 着 ,不 论 均 值 u 与 方差 e 是 多 少 , 任 一 正 态 分 布 的 峰 度 B, 永远 为 
直 ,可见 , 这 里 谈论 的 “ 峰 度 ”不 是 指 一 般 密 度 了 消 数 的 峰值 高 低 , 那 么 这 里 的 “ 峰 
值 ” 含 义 是 什么 呢 ? 假如 在 定义 2. 5.4 中 ,对 分 子 和 分 母 各 除 以 a‘( 标 准 差 的 4 
次 方 ), 并 记 X 的 标准 化 变量 为 了 X* = 二 (XX 一 EX)/a, 则 Bs 可 改写 为 

8,= E(X*) 
[ECX*):Y 

其 中 (XX")* 二 Var(X*)= 二 1, 由 于 标准 化 正 态 变量 ( 记 为 上 ) 的 四 阶 原点 矩 E 
(U”)= 二 3, 故 峰 度 p 实际 上 是 任 一 标准 化 变量 与 标准 化 正 态 变量 的 四 阶 原点 
定之 差 .以 单 峰 分 布 为 例 , 当 B:>0 时 , 即 天 (X") SEU, ,这 意味 着 和 "在 零 
附近 集中 取 值 的 概率 要 大 于 标准 化 正 态 变量 ,从 而 其 密度 在 零 附近 的 峰 要 比 
标准 化 正 态 分 布 的 峰 高 ,对 8B, 二 0 也 可 作 类 似 解释 。 表 2. 5. 1 列 出 常见 的 四 个 
分 布 的 峰 度 ,均匀 分 布 的 密度 函数 很 平坦 ,其 峰 度 比 正 态 分 布 峰 度 低 ,呈现 负 
值 。 指 数 分 布 的 密度 函数 为 尖 峭 ,其 峰 度 比 正 态 分 布 峰 度 高 ,呈现 正 值 。 可 以 
预计 , 当 8:< 一 1.2 时 ,其 密度 函数 会 呈 U É, 


—3=E(X”* )'-3 
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表 2.5.1 几 种 常见 分 布 的 峰 度 
标准 化 变量 的 


差 | 峰 度 
38 万 DEBERA 

均匀 分 布 U (a,5) (a+b)/2 (85 一 2)2/12 1.8 —1. 2 
正 态 分 布 NCu,sa) pl g? 3.0 0 
指数 分 布 Exp (02) 1/A 1/2? 9.0 6 
(11133 4) 41 Gala, A) alà? af A? 3 十 6a 6/a 


例 2. 5.3 计算 分 玛 分 布 Gala,4) 的 偏 度 与 蜂 度 。 
解 :容易 算出 伽 玛 变量 的 下 阶 原点 和 扰 
p=EX*=a(a+ 1)" (a+ 1/2 
由 此 可 得 其 前 四 阶 原 点 矩 分 别 为 
y =a/A 
py =ala+1)/2 
p3=ata+1)(a+2)/4* | 
pu=ata+1)(a+2)(a+3)/2 
从 而 可 算得 二 阶 . 三 阶 和 四 阶 中 心算 
v = p — pi = a / à? 
v3 = M3 — 3p yı H 24i 2a/4 
v = pu — 4 31 + 6p pi — 3i = 3a la+ 2v? 
从 而 可 得 匈 玛 分 布 的 偏 度 Bi 与 峰 度 B， 
Ya 


y 
A= ¿yal a, B2= 7 2 3=6/0 


可 见 伽 玛 分 布 的 偏 度 与 峰 度 只 与 形状 参数 w 有 关 , 而 与 尺度 参数 4 无 关 , 特 
别 , 当 a $E KHF, Em a 之 100 时 ,Bi 与 A: 都 接近 于 零 , 傣 玛 分 布 也 愈 来 愈 近似 


正 态 分 布 。 


2.5.5 中 位 数 


随机 变量 X 的 中 位 数 是 将 X 的 取 值 范围 分 为 概率 相等 (各 为 0.5) 的 两 部 
分 的 数值 。 它 常 在 连续 随机 变量 场合 使 用 , 故 下 面 只 对 连续 随机 变量 给 出 定义 。 
定义 2.5.5 设 连续 随机 变量 X 的 分 布 函 数 为 F(z) ,密度 函数 为 p(x)， 


则 满足 条 件 
F (zo) = | pdz = 0.5 
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a 


的 值 zos PRA X SAGA PARA) KER X 的 中 位 点 , 见 图 2e 5. 4o 


2.5.4 连续 随机 变量 的 中 位 数 ro. 


中 位 数 与 均值 一 样 都 是 随机 变量 的 位 置 特征 数 , 一 个 随机 变量 的 均值 可 
以 不 存在 ,而 它 的 中 位 数 总 存在 ,一 般 中 位 数 可 从 方程 F(z)==0.5 求 得 。 壁 如 
指数 分 布 Exp (4) 的 中 位 数 To. 5 可 由 方程 l1—expi—Azxo.5)=0. 5 解 得 Los 一 
In2/4。 当 分 布 是 对 称 时 ,对 称 中 心 就 是 中 位 数 ,譬如 正 态 分 布 N (x,o) 的 中 位 
数 Zo, ;就 是 均值 Ho 

中 位 数 很 有 用 ,有 时 比 均值 更 能 说 明 问题 .譬如 甲 厂 的 电视 机 寿命 的 中 位 
数 是 25000 小 时 , 它 表 明 甲 三 的 电视 机 中 一 半 高 于 25000 小 时 , 另 一 半 低 于 
25000 小 时 。 者 乙 厂 的 电视 机 寿命 的 中 位 数 是 30000 小 时 , 则 乙 厂 的 电视 机 在 
寿命 质量 上 比 甲 厂 好 .又 如 一 个 城市 职工 的 年 收入 中 位 数 是 一 万 元 ,这 告诉 人 
们 ,该 城市 职工 中 有 一 半 人 年 收入 超过 一 万 元 , 另 一 半 低 于 一 万 元 。 


2.5.6 分 位 数 

与 中 位 数 一 样 ,分 位 数 也 常 在 连续 随机 变量 场合 使 用 , 故 下 面 仅 对 连续 随 
机 变量 给 出 分 位 数 的 定义 。 

定义 2. 5.6 设 连续 随机 变量 X 的 分 布 函 数 为 F(x)， 密度 函数 为 plo)» 
对 任意 ec(0<a<<1) ,假如 ze 满足 条 件 


F(x.) = | pæd 一 Q 
则 xz, FAX ABD a 分 位 数 ,或 称 a 下 侧 分 位 数 。 假 如 z。 满 足 条 件 
1= F (x'a) = | ,plz)az 一 a 
则 z'。 称 为 分布 的 a 上 侧 分 位 数 ,它们 的 区 别 见 图 2. 5.5. 
常用 分 布 的 分 位 数 可 从 分 布 函数 表 中 查 得 ,从 上 述 定义 和 图 可 以 看 出 ， 
z 一 Zi-， 知 道 e( 下 侧 ) 分 位 数 , 立 即 可 转化 为 1 一 < 上 侧 分 位 数 .中 位 数 就 是 
0.5 分 位 数 ,分 位 数 在 实际 中 也 常 使 用 。 璧 如 ,轴承 的 寿命 是 较 长 的 ,为 了 比较 一 
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轴承 寿命 的 长 短 , 常 用 a = 0.1 的 分 位 数 zo.1, 它 表示 有 10% 的 轴承 在 co 前 
损坏 ,显然 ,对 应 较 大 zo 的 轴承 质量 较 高 。 


p(x) 


X Xa 
(a) X 下 侧 分 位 数 (b) a 上 侧 分 位 数 
图 2.5.5 


例 2. 5. 4( 正 态 分 布 的 分 位 数 ) 正 态 分 布 NCp,0?) 的 户 分 位 数 ,满足 如 
下 方程 


其 中 pe D 为 标准 正 态 分 布 函数 ， 其 反 了 消 数 记 为 -1(*), 则 有 
= p + op“ (p) 
= u + 04, 
HP OD" (p) = up E Pu) = p, AXR u, 是 标准 正 态 分 布 N(0,I) 的 pp 的 
分 位 数 , 它 可 从 标准 正 态 分 布 表 中 查 得 .譬如 , 正 态 分 布 NW(100,82) 的 0.9 分 
位 数 为 
© Xog = 100 + 8uo o 
从 标准 正 态 分 布 表 ( 附 表 3) 查 得 uos = 1.282, 代 入 上 式 , 可 算得 too = 
110.256, | 
分 位 数 在 统计 中 经 常 使 用 ,特别 是 统计 中 常用 的 三 大 分 布 分 位 数 ,为 此 特 
地 编制 了 它们 的 分 位 数 表 , 它 们 是 : 分 布 分 位 数 表 ( 附 表 4) ;x 分 布 分 位 数 表 
( 附 表 5) 和 五 分 布 分 位 数 表 ( 附 表 6) ,从 这 些 表 上 可 直接 查 得 各 种 分 位 数 。 


x 2.$.7 ARE 
定义 2.5.7 假如 半 是 离散 随机 变量 , 则 X 最 可 能 取 的 值 (即使 概率 P(X 
= 12) 达到 最 大 的 > 值 ) 称 为 证 分 布 的 众 数 ,假如 六 是 连续 随机 变量 , 则 使 其 密 
度 函 数 p) 达到 最 大 的 二 值 称 为 和 RRX 的 众 数 常 记 为 Mod OO, 
众 数 也 是 随机 变量 的 一 种 位 置 特征 数 , 在 单 蜂 分 布 场合 , 众 数 附近 常 是 随 
机 变量 最 可 能 取 值 的 区 域 , 故 众 数 及 其 附近 区 域 是 受到 人 们 特别 注视 的 。 艾 
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如 ,生产 服装 、 鞋 、 帆 等 的 工厂 很 重视 最 普遍 、 最 众多 的 尺码 ,生产 这 种 尺码 给 
他 们 带 来 的 利润 最 大 ,这 种 最 普 过 、 最 众多 的 尺码 就 是 众 数 。 

例 2.5.5 寻求 二 项 分 布 b(n,p) AX. 

解 : 设 X ~ bln,p) ,i 


bx)» = MESS — p) 7, x=0,l,""2n 


名 比较 相 邻 二 个 概率 


bx) — MIT DP_, ¿MDP 
OZ — 1) T(l — $) a(l— $) 


31< (an + DON) EXHAÉRT 1,6 blr) Hh; z> 十 1)p 时 ,上 述 
比值 小 于 1, 故 blr) 减少 ,可 见 gz) 在 (十 1)z 附 近 达 到 最 大 ; 当 z 一 (Ca + 
Dp = m 为 整数 时 ,blm) = 二 blm 一 1), 且 为 最 大 ,这 时 二 项 分 布 b(m,p) 有 两 
LAB EMO + 1)p 和 十 1)p 一 1。 

H (a 十 De 不 为 整数 时 , 必 存 在 一 个 整数 mm, 使 得 

(a+ 1D Dp—1l<m<= (n+ Dp 

这 时 bm) 达到 最 大 ,此 m 就 是 (x 十 1)p 中 的 整数 部 分 ,可 记 为 m = [n + 
1)pj. 综 合 上 述 , 二 项 分 布 bln,p) 的 众 数 为 
(n + Dp Ma + Dp— 1, Mía + Deo 为 整数 
[(a + Dp] 4 (n + Do 不 为 整数 

譬如 ,二 项 分 布 &%6,0. 9) 的 众 数 Mod(X) =[(6+ 1) Xx 0.9] = 6, 二 项 
分 布 (6,0.5) 的 众 数 Mod(X) = [6 + 1) Xx 0.5] = 二 3。 最后, 二 项 分 布 
b(7,0. 5) 的 众 数 有 两 个 ,Mod(X) = 3 和 4, 因 为 这 时 (nn 十 1)p= (7 十 1)X 
0.5 = 4.0 为 整数 。 


Mod(X) = 
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第 三 E ETS 


多 维 随机 变量 


331 多 维 随机 变量 及 其 联合 分 布 


3.1.1 多 维 随机 变量 

在 有 些 随机 现象 中 ,每 个 基本 结果 w 只 用 一 个 随机 变量 X,(w) 去 描述 是 
不 够 的 ,而 要 则 时 用 多 个 , 璧 如 同时 用 二 个 随机 变量 X (o), X a (w), +» ,X, (0) 
去 描述 ,这样 就 引出 多 维 随机 变量 概念 ，。 : 

定义 3.1.1 若 随 机 变量 和 (wo) ,XX,《w),… X, C) 定义 在 同一 个 基本 空 
EQ = (0) 上 , 则 称 

X(w) = (X,(0),X¿(w),"",X,(w)) 

是 一 个 n 维 随机 变量 ,或 称 n NO TA, da: A 
述 的 随机 变量 ， 

例 3.1.1 多 维 随机 变量 的 例子 

(1) 在 研究 四 岁 至 六 岁 儿 童生 长 发 育 中 ,很 注意 每 个 儿童 (基本 结果 ) 自 
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' AO po h la rT BA kra- rl si, pe .5 A sea 


己 的 身高 Xi(Cwo) HATE X Cw) AEX (0) ,X (0) ) 就 是 一 个 二 维 随机 变量 。 

(2) 每 个 家 庭 ( 基 本 结果 o) 的 支出 主要 用 在 衣食 住 行 四 个 方面 。 假 如 用 
Xil), Xw), X; w), X, o) 分 别 表 示 每 个 家 庭 w 的 衣食 住 行 的 花费 占 其 总 
收入 ( 按 年 计算 ) 的 百分比 , 则 (Xi XX A) 就 是 很 引起 经 济 学 家 兴趣 的 四 
维 随机 变量 ， 

《3) 从 一 批 产 品 中 随机 抽取 nn 件 , 一 等 品 、 二 等 品 、 三 等 品 和 不 合格 品 的 件 
数 分 别 记 为 XX XX MCX, XXX) 就 是 人 们 很 关心 的 四 维 随机 变 
E ,这 里 基本 结果 ww 可 以 用 长 为 n 的 由 1,2,3,4 等 四 个 数字 组 成 的 序列 表示 ， 
其 中 1,2,3 分 别 表示 一 等 品 、 二 等 品 、 三 等 品 ,4 表示 不 合格 品 。 

(4) 炮弹 的 着 落 点 的 位 置 (X,Y) 就 是 指挥 官 关心 的 二 维 随机 变量 。 

《5 遗传 学 家 很 关心 儿子 的 身高 和 与 父亲 的 身高 了 之 间 的 关系 ,这 里 (和 X， 
Y) 束 是 一 个 二 维 随 机 变量 。 

一 般 说 来 , 告 需 要 同时 研究 x 个 随机 变量 时 ,就 会 遇 到 多 维 随机 变量 。 


3.1.2 联合 分 布 函 数 

多 维 随机 变量 的 概率 分 布 可 以 用 联合 分 布 函数 来 表示 ，。 

定义 3.1.2 EX = (XX2, Xn) 是 维 随机 变量 ,对 任意 个 实数 
Lo ,Ts 所 组 成 的 n 个 事件 “X， 人 XI CE EA ARRE 
的 概率 


Plz gota) = P(X Ti, X S Ts, Xn < x,) (3.1.1) 
称 为 n 维 随机 变量 X 的 联合 分 布 函 数 。 
在 二 维 随机 变量 (X,Y) 场 合 ,联合 分 布 函 数 (z,y) 是 交 事件 “XX 之 zx” 中 
“Y < y” 的 概率 ,假如 让 yy 一品 , 则 事件 “Y < co” 是 必然 事件 ,从 而 上 述 交 事 
FEH X<” N A= “久之 zx”, 而 其 概率 就 是 外 的 分 布 函数 Fx(z) ,上述 极 
限 过 程 可 表示 为 
li m F(x,y) = P(X K z,Y < o) 
= P(X < x) = Fxr(r) 
这 个 极限 过 程 常用 F(z,co) Rx, E 
li m F(x, y) = Fíx,o) = F(z) (3. 1. 2a) 


基 似 地 ,还 可 从 联合 分 布 函数 Fa, y) 获得 Y 的 分 布 函数 
li m F(x,y) = F(eo, y) = Fy(y) (3. 1. 2b) 
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这 两 个 分 布 函 数 Rx(z) 和 Fy(y) ABRAS AX F (my) 的 边缘 分 布 函 
E ,或 简称 边缘 分 布 。 
例 3.1.2 设 二 维 随机 变量 (X,Y) 的 联合 分 布 函 数 为 
lee? qee, r> 0,y>0 
0, 其 它 场合 
这 个 分 布 称 为 二 维 指数 分 布 . 其 中 参数 4 之 0。 
利用 (3. 1. 2) ,容易 求 得 (X,Y) 的 边缘 分 布 郴 数 


F(zr,y) = 


le“, z>o0 

Fxtz)= Fízx,oo) = F 0 
Fy(y) = Foo, y) = po y 20 
, TELLO 


它们 都 是 一 维 指数 分 布 函数 , 且 与 参数 无关。 不 同 的 人 对 应 不 同 的 二 维 指数 
分 布 , 而 它们 的 两 个 边缘 分 布 不 变 , 这 说 明 : 二 维 联合 分 布 不 仅 含 有 每 个 分 量 
的 概率 分 布 ,而 且 还 含有 两 个 变量 XX 与 Y 之 间 关 系 的 信息 ,这 正 是 引起 人 们 研 
究 多 维 随机 变量 的 原因 。 
石 取 参数 A = 1, 可 以 计算 下 列 捉 件 的 概率 ， 
P(X < 0.5,Y < 0.3) = F(0.5,0.3) 
= ] — e7’ — e™™3 4 e7% — 0. 03939 
P(X < 0.5,Y < 1.3) = F(0.5,1.3) 
= 1] es ere? — 0, 20723 
P(X<X0.5,0.3< Y < 1. 3) 
= P(X 0. 5b,Y < 1.3) -— P(X<0.5+.Y < 0. 3) 
= F(0.5,1.3) — FC(0. 5,0. 3) 
= 0. 20723 — 0. 03939 = 0. 1678 


3.13 ”多维 离 作 随机 变量 

像 一 维 随机 变量 那样 ,多维 随 机 变量 也 有 离散 与 连续 两 类 ,这 里 先 研究 二 
维 离散 随机 变量 。 多 维 离散 随机 变量 的 研究 亦 可 类 似 进 行 。 

例 3.1.3 假如 二 维 随机 变量 (X,7) 的 每 个 分 量 都 是 一 维 离散 随机 变 
量 , 则 称 (X,Y) 为 二 维 离散 随机 变量 .者 设 {zi ,Z2y… 和 ty Y2») 分 别 为 X 
和 了 的 全 部 可 能 取 值 , 则 概率 

P(X = x; Y = y;) = pj 1 一 1 2， 1] = 1,2," 
全 体 称 为 (X,Y) 的 概率 分 布 ,简称 二 维 离散 分 布 。 
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显然 ,作为 二 维 离散 分 布 {pij} 应 满足 条 件 : 
pi = 0, SY p= 1 (3.1.3) 
gw | 
pi = ps pi= Zp (3. 1. 4) 
WXY) 的 二 个 边缘 分 布 为 
P(X =x)=P(X = Ti, Y < o) 
= > P(X= Xi, Y = yy) 


= Pps = pe, im olor (3. 1. 5a) 


por = 1 = Dp jj j= EAS (3. 1. 5b) 
613.13 设 (X,Y) 的 联合 分 布 如 下 表 所 示 


1 0. 2 0. 2 0 


其 中 和 可 取 0 与 1 两 个 值 ,7 可取 0,1,2 等 三 个 值 , 表 的 右 下 方 是 联合 概率 , 璧 
如 P(CX 一 07Y 一 1) 一 0.4。 这 6 个 联合 概率 满足 条 件 (3. 1. 3), 故 组 成 二 维 随 
机 变量 (X、Y) 的 联合 概率 分 布 。 
(1) 寻求 概率 P(X +Y <1). 
由 于 事件 “X 十 了 过 1” 是 由 数 对 C0,0), (0,1) 和 (1,0) 组 成 , 故 它们 对 应 
概率 之 和 就 是 所 求 事 件 的 概率 , 即 
P(X +Y <1) = P(X =0,Y =0 +P(X =0,Y =1)++P(X =1,Y = 0) 
=0.1+0.4+0.2=0.7 
(2) 寻求 和 的 边缘 分 布 。 
由 于 事件 “X = 0” 是 由 数 对 (0,0),(0,1),(0,2) 组 成 , 故 
P(X=0)= P(X=0,Y =0)+P(X=0,Y =1)+P(X =0,Y =2) 
=0.1+0.4+0.1=0.6 
这 正 是 上 述 联合 分 布 表 中 第 一 行 三 个 概率 之 和 .类似 地 ,上 表 中 第 二 行 三 个 概 
率 之 和 就 是 “X = 1” 的 概率 , 即 
P(X =1)=0.2+0.2+0=0.4 
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上 述 二 个 行 和 正好 组 成 忒 的 边缘 分 布 , 类 行 地 , 表 上 三 个 列 和 正好 组 成 了 的 边 
缘分 布 . 具 体 可 用 下 表 表 示 : 


列 和 0. 3 0. 6 0. 1 1.0 


由 于 行 和 位 于 上 表 的 右边 , 列 和 位 于 上 表 的 下 边 ,边缘 分 布 的 名 称 也 就 由 此 得 来 。 

例 3. 1. 4( 多 项 分 布 ) ”多 项 分 布 是 最 重要 的 多 维 离散 分 布 , 它 是 二 项 分 
布 的 推广 .大 家 知道 ,二 项 分 布 产 生 于 次 独立 重复 贝 努 里 试验 ,其 中 每 次 斌 
验 仅 有 两 个 可 能 结果 :成 功 与 失败 ,如 今 多 项 分 布 产生 于 nn 次 独立 重复 试验 ， 
其 中 每 次 试验 有 和 多 于 两 个 结果 。 辟 如 把 制造 的 产品 分 为 一 等 品 、 二 等 品 、 三 等 
品 和 不 合格 品 等 四 种 状态 :学生 考试 成 绩 被 评 为 4.B、.C.D 和 五 等 五 级 ;一 项 
试验 被 判 为 成 功 、 失 败 和 无 确定 结果 等 三 种 可 能 ,一 般 , 当 把 一 个 总 体 按 某 种 
属性 分 成 几 类 时 ,就 会 产生 多 项 分 布 , 现 把 多 项 分 布 产生 的 条 件 叙 述 如 下 ， 

(1) 每 次 试验 可 能 有 ~ 种 结果 .A), A,,… ,A,。 

(2) 第 i 种 结果 A 发 生 的 概率 为 pisi = 1,2,…,r, 且 

pi + pz: t° + p. =l 

(3) 对 上 述 试验 独立 地 重复 次 ,这 次 试验 的 结果 可 用 某 些 A 组 成 (多 
WER) 的 序列 (长 为 n) 表示 ,譬如 ,下 面 的 序列 就 是 次 重复 试验 的 一 个 结 
A 

A/A,” A, AJA, Aso” A, A," A, 3.1.6 
nı 个 n: 个 n, 个 o 
其 中 请 ni 为 非 负 整 数 , 且 zi 十 2z 十 … 十 ?tr 一 n。 由 于 独立 性 ,这 个 结果 发 生 的 
概率 为 
pupa" py 

容易 看 出 ATEO. 1.6) 中 各 A; 出 现 次 数 不 变 ,而 把 它们 打 乱 后 重新 

排 成 一 列 ,不同 的 排列 共有 


n! 
niin>! +" n,! 


个 ,并 且 每 个 序列 的 概率 仍 为 pipz pr. 
MALE KARPA X, 表示 Ar 出 现 次 数 ,X, 表示 A 出 现 次 数 ,…， 
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X, 表示 A, BIKI MCX Xo X) 是 7 维 随机 变量 ,并 且 事 件 Xi = m, 
X: = nz,… X, = n, 同时 发 生 的 概率 为 | 

P(X, = mX: = my X, = n) 一 bp (8.1.7) 
其 中 诸 n JENER, H n tn t etn =n .这 就 是 多 项 分 布 , 记 为 M(n, 
A IS AGEMA n RRR SEA aJ N 


(pi 十 Pz 十 …" 十 Pr)" 一 Yew 


n tnst tn =n 


n! 
1711722 1。 


2 py =|] 


(3.1. 8) 
所 有 形 如 (3.1.7) 所 示 的 概率 组 成 了 一 个 多 维 离散 分 布 , 多 项 分 布 的 名 称 也 
由 此 而 来 。 
当 7 二 2 时 ,多 项 分 布 就 退化 为 二 项 分 布 。 | 
多 项 分 布 有 广汉 应 用 。 辟 如 ,把 产品 分 为 一 等 蝇 (41), 二 等 品 (4,) ,三 等 
品 (4:) 和 不 合格 品 (44) 等 四 类 时 , 若 设 
P(A) = 0.15, P(A,) = 0. 60, PC(A,) = 0.20, P(A,) = 0.05 
如 今 从 一 大 批 产 品 中 随机 取出 10 个 ,其 中 一 等 品 有 ?2 个 .二 等 品 有 6 个 、 三 等 
品 有 2 个 .而 没有 不 合格 品 的 概率 为 
P(X: = 2, X: = 6, X3=2,X,=0) 
— 10! 
21 61 21 01 
= 0. 0529 
其 中 XiX X: X 分 别 表示 10 个 产品 中 一 、 二 .三 等 品 和 不 合格 品 的 个 数 。 
可 以 证 明 ， 多 项 分 布 Mín, pis P2""" > pr) 中 任 一 个 分 量 的 边缘 分 布 是 二 项 分 
MAX, AX 可 以 取 0,1,2,…，2 个 值 中 任 一 个 。 由 边缘 分 布 定义 可 知 
P(X, = ni) = SNS. > TO "pr 


n, + +n =n n, 
其 中 Mas" ny 分 别 是 Az” ¡A 的 取 值 ,都 是 非 负 整数 ， 其 和 必 为 z MA 


g = 2, a. g = Pr 
2 l — p, ' r l 一 $, 


Met + pS t t pA O p) 一 1。 若 把 上 式 改写 为 


PX =m = (DE D roer Peep] 


n+- -+n p >H 


(0. 15)2(0. 60)*(0. 20)?(0. 50)" 


pa po 


| 
nl(n— n, ) ! 
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利用 3.1.8 去, 上 式 右 奖 第 一 个 括 与 为 1, 于 古 得 到 


P(X, =n) = 7 lona — py)", m =0,1,**,2 
这 正 是 二 项 分 布 6(n,p1), 即 次 独立 重复 试验 (每 次 试验 只 有 二 种 可 能 A, 和 
A = Á? U A; U s.s U A,) 中 Al 出 现 "i 次 的 概率 。 类 似 地 可 写 出 X? 的 边缘 分 


布 为 bin, p2) 等 等 。 


3.1.4 ”多维 连续 随机 变量 

为 简单 起 见 , 以 下 叙述 仅 对 二 维 连续 随机 变量 进行 .读者 不 难 把 它 推广 到 
三 维和 更 高 维 场合 。 

定义 3.1.4 BARBARA, Y) 的 分 布 函 数 为 F(x,y) ,假如 各 分 量 X 
和 了 都 是 一 维 连续 随机 变量 ,并 存在 定义 在 平面 上 的 非 负 函数 po) ,使 得 


F(x,y) = f r plr, y)dzdy (3.1. 9) 


则 称 (X,Y) 为 二 维 连续 随机 变量 ,p(x,y) 称 为 (X,Y) 的 联合 概率 密度 函数 ， 
或 简称 联合 密度 。 

在 这 个 定义 中 特别 强调 ,只 有 具有 联合 密度 pay) 的 二 维 随机 变量 才 
能 称 为 二 维 连续 随机 变量 。 在 给 出 联合 密度 pC(z,y) 后 ,与 (X,Y) 有 关 的 事件 
XA, Y) E S”( 见 图 3.1.1a) 的 概率 都 可 用 二 重 积 分 表示 ,然后 设法 化 为 累 次 
PATA. S 


P(X,Y) € S) = [»=,pazdy = | | prs)dydz (3. 1. 10) 
当 S 为 长 方形 ( 见 图 3. 1.1b) 时 ,可 直接 用 累 次 积分 计算 . 
Pla < X <b, <Y< d) = f pa y)dydz (3.1.11) 
其 中 不 等 叶 改 为 "< 委 ”(3.1. 11) 仍然 成 立 , 因 为 平面 上 直线 的 面积 为 零 。 


图 3. 1. la 图 3. 1. 1b 


实际 中 ,很 多 二 维 连续 随机 变量 的 概率 分 布 都 是 用 联合 密度 p(x,y) 给 
出 的 ,不 过 ay) 都 应 满足 如 下 二 个 条 件 ， 
pl(z,y) 守 0 | 


| | pl(r,ydrdy = 1 


E RES DN ME RN AMA EF, y) 给 出 的 , 则 由 (3. 1.9) 可 知 , 在 F(x,y) 
的 偏 导 数 存在 的 点 上 可 写 出 其 联合 密度 


y | 
pr, y) = a E) (3.1.13) 


”而 在 (zx,y) 的 篇 导数 不 存在 的 点 上 p(z,y) 的 值 可 任意 用 一 个 常数 给 出 ,这 
不 会 影 啊 以 后 有 关 事 件 概 率 的 计算 结果 。 因 为 这 类 点 组 成 的 集合 发 生 的 概率 
由 联合 密度 p(x,y) 不 难 求 出 各 个 分 量 的 概率 密度 。 璧 如 X 的 分 布 函数 

可 改写 为 


(3. 1. 12) 


Fxtx) = P (X <S 工 ， Y < 00) 


y E. ([7_pta,yrdy jaz | 


= | pxladdz 
其 中 
px(z) 一 | pla, dy (3. 1. 14a) 
就 是 X 的 概率 密度 函数 ,类 似 可 得 了 的 概率 密度 函数 
Py(y) = | _aczvy)az (3. 1. 14b) 


PO 和 py(y) 又 称 为 (X,Y) 的 (或 p(z,y) 的 ) 边缘 密度 函数 ， 
例 3.1.5 设 (X,Y) 的 联合 密度 函数 为 
be “73, >0,y>0 
O, 其 它 场合 
试 求 :(1)P(X<17>1)， DPA >Y); (3) (X,Y) 的 边缘 密度 函数 。 


plz, y) = | 


解 :(1) P(X<1 Y>D=h, 6e “e *dydx 


1 OO 


= 6 ezda], e "dy 


— 1 一 2 | 1 -| 
6| 7 e 3 e 
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—=(1—e Y)e”?=0. 8647 X0. 0498=0. 0431 


(2) P(X>Y) = || eesazdy 
上 述 积 分 区 域 如 图 3. 1.2 上 的 阴影 部 分 ,从 而 容易 写 出 累 次 积分 


P(X>Y)= | | Ge “evadydz 
g 0 


= [zea — e “Mx 


(3) pra) =| be Hp Vay = 207", 
0 


Py(y) — | See an o 2e Y, 
0 
mz <o0BH,p, (2) =0:% y<0H,p, (y) =0, 


图 3.1.3 二 维 均匀 分 布 区 域 


例 3. 1.6( 二 维 均匀 分 布 ) ”向 半径 为 > 的 圆 内 随机 投 点 , 落 在 圆 内 面积 相 
等 的 不 同 区 域 ( 如 图 3.1.3 上 圆 内 二 个 正方 形 ) 内 是 等 可 能 的 。 若 把 坐标 原点 
放 在 圆心 , 落 在 坐标 (z,y) 的 联合 密度 函数 为 
lr, y) = c， BGxr+y<r 
PAI Y 0) Gr+y>y 
其 中 < 为 某 一 常数 .这 个 二 维 分 布 称 为 在 圆 上 的 均匀 分 布 . 类 似 可 定义 长 方形 
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上 的 均匀 分 布 .椭圆 上 的 均匀 分 布 以 及 平面 上 任 一 有 限 区 域 上 的 均匀 分 布 。 
(1) 确定 c 的 值 。 
(2) 求 (X, 了 ) 的 边缘 密度 郴 数 。 
(3) 计算 落 点 (X,Y) 到 原点 的 距离 Z = MX +Y RAKT a 的 概率 (0 < 
a<r), 
解 :(1) 由 条 件 (3.1.12) 可 知 
dady = 1 


z ly yg? 


由 于 上 述 积分 表示 圆 的 面积 , 故 等 于 ar AMA e = ara, 
(2) AR XA, a < r i 有 


px (x) =| p y)dy = 一 5 al dy 


aho 
Vir — y 
= 二 | G7 dy = E ¿Nr a 


Mx > r’ Hi, p, (2) 一 0。 类 似 地 可 求 出 了 的 边缘 密度 函数 
1 
— Jr? 一 yi, ¿E y? 
bO) — | y y 
0, 


y > y? 
《3) 所 求 的 概率 为 
P(Z Sa) = PWX’? +Y? <a) = P(X? +Y? La) 
y II pa, y)dzdy 一 2 dxrdy 
x + ya e t +y La? 
_ Taf a’ 
ar. y 


例 3. 1. 7( 二 维 正 态 分 布 ) ”联合 密度 函数 为 

l rpl- 笃 一 7 
270103 VETA 2(1 一 AL a? 
PA DOY 9 42) 


020) o$ 


pix, y) 一 


— o <L zy<c 十 co (3. 1. 15) 
的 二 维 分 布 称 为 二 维 正 态 分 布 ， 它 是 最 重要 的 二 维 连续 分 布 。 它 从 有 五 个 参数 
fpJ2，01，02 和 p RREN 围 分 别 为 ， 
— 9 <p L 00), — 00 < p< 00,6, >0,06,>0, -—1<p<1 
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党 把 这 个 分 布 记 为 NUCA ;L2901902 ODIA A BER 数 在 Ox y 平面 上 的 图 形 很 
象 一 顶 四 周 无 限 延 伸 的 草帽 ( 见 图 3.1. 4) ,其 中 心 在 点 (CA ,He) 处 。 


图 3.1.4 二 维 正 态 密 度 函 数 


下 面 证 明 一 个 重要 结论 ;二 维 正 态 分 布 的 边缘 分 布 是 一 维 正 态 分 布 . 即 若 
(X,Y) ~ N(41 2,0130, 0), 5] X ~ N(4,00),Y ~ N (pow,02) ,首先 ,把 二 维 
ESTERERRX pry) 的 指数 部 分 ( 见 (3.1.15) A) 改写 为 

o 2 _ 2 
1 1 [E p) —20 (z 一 y) Cy Hh) Y £] 


2 1— ø g? 0,8, g? 
_ io- _ Y | Ga 
2h o V1=P ozV1 Pe 203 
于 是 XX 的 边缘 密度 函数 为 
Pa) = | plz,y)dy 
(a =a | 
210,0, N1 — p” 


oo il zp č y-k 
x f" exf- te- A o, VI 
然后 对 积分 变量 y 作 如 下 变换 (注意 把 z 看 作 常 量 )， 
A 


p 
a V11—= pp. ov 一 


TA y — Po i 
- | jas 


f = 


则 上 式 可 化 为 
exp 1 一 cz 元 人 | 加 2 


Py) 二 一 OO。 
A 210,0) NN 1 一 一 o” — 09 


a PL r ir pF, PT ~ ee enter gP- "+ TEPPER —inhn r- H ~ , 


注意 到 上 式 中 的 积分 恰好 等 于 V2x, 故 有 


1 la — pm) 
PCT) = e] == 20? | 
这 正 是 一 维 正 态 分 布 N Ga D 的 密度 函数 。 类 似 地 ,可 求 得 了 的 边缘 分 布 是 


N (p02), 
顺便 指出 ,由 (3.1. 15) 式 表示 的 p(x,y) 显然 是 非 负 的 , 义 由 于 


| | pl,wardy=| pr(r)dr=1 


因此 就 验证 了 (3.1.15) 式 表 示 的 p(z,y) 确 是 一 个 二 维 密度 函数 。 

从 这 个 例子 还 可 看 出 一 个 有 趣 的 现象 :由 二 维 联合 分 布 可 以 唯一 决定 其 
每 个 分 量 的 边缘 分 布 ,但 反 过 来 不 成 立 . 即 知道 XX 与 Y 的 边缘 分 布 , 也 不 足以 
决定 其 联合 分 布 。 壁 如 考虑 两 个 二 维 正 态 分 布 

N(0,0,1,1,1/2) 和 NN(0,0,1,1,1/3) 

它们 的 任 一 边缘 分 布 都 是 标准 正 态 分 布 W(0,1)。 但 这 两 个 二 维 正 态 分 布 是 不 
同 分 布 , 因 为 其 参数 o 的 数值 不 同 。 引 起 这 个 现象 的 原因 是 :二 维 联合 分 布 不 
仅 含 有 每 个 分 量 的 概率 分 布 ,而 且 还 含有 两 个 变量 XX 与 Y 之 间 关 系 的 信息 ,后 
者 正 是 人 们 研究 多 维 随机 变量 的 原因 ,以 后 会 看 到 ,这 里 参数 p 的 值 将 会 反映 
二 个 变量 和 与 了 之 间 关 系 密切 的 程度 。 


$3.2 随机 变量 的 独立 性 


3.21 随机 变量 的 独立 性 

在 多 维 随机 变量 中 ,各 分 量 的 取 值 有 时 会 相互 影响 ,有 时 会 毫 无 影响 。 臂 
如 在 研究 父子 身高 中 ,父亲 的 身高 Y 往 往 会 影响 儿子 的 身高 中 .假如 让 父子 各 
MET MAN AY, 与 X 相互 间 就 看 不 出 有 任何 影响 .这 种 相互 
之 间 没 有 任何 影响 的 随机 变量 称 为 相互 独立 的 随机 变量 ,本 节 将 研究 这 类 多 
维 随机 变量 . 另 一 类 将 在 § 3. 4 中 研究 。 

定义 3.2.1 MX Xz ¡AX En ERAN DIR EER n MEM a, Tos 
… ,Tr EN n PRF Xs a “过 XX, S z,” 相 互 独立 , 即 有 

P(X, < Lis X2 < Lars A < Tn) 
= P(X, S DPX, L 21 "P(X,<x,) (3.2.1) 
或 F(E, m2 Ts) = F(x) Fs laz) Fln) (3. 2. 2) 
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则 称 严 个 随机 变量 X,X,X 相互 独立 ,否则 称 X A 00 An DAIRI, 
或 称 相依 的 。 其 中 Fasa 为 (XXX 的 联合 分 布 阴 数 ， 
Fi Cri) Fa CE2) stet FT) 分 别 是 和 1， 从 2 E SUE A 
例 3.2.1 在 例 3.1.2 中 已 给 出 二 维 指数 分 布 函数 
— e? + eTii, 4 r>0,y>0 
0 ， ”其 它 场合 
其 中 4 之 0。 它 的 二 个 边缘 分 布 函数 分 别 是 


le * 
F(zx,y) = | 


Es >0 

Fr 一 | Í Ha 
0 $ kro 
l—e”, | 当 >0 

Fo = | > 
0 9 当 y 委 0 


TRABA AA UE A 0 时 ,有 
Fr, y) Æ F(X)F, (y 
XIT X 与 了 不 是 相互 独立 的 随机 变量 .而 和 王 0 时 ,有 
F(x,y) = F(x)F, (Cy) 
这 时 XX 与 Y 是 相互 独立 的 随机 变量 ， 
在 多 维 离散 随机 变量 场合 ,独立 性 条 件 (3. 2. 2) 等 价 于 下 述 条 件 : 对 任意 
n 个 实数 L]9Lzy* “za 都 有 
PLA! = Ti 入 = To 人 一 Tn) 
= P(X, = z )P(X: = z) P(X, = rx) (3.2.3) 
在 多 维 连 续 随机 变量 场合 ,独立 性 条 件 (3. 2. 2) 又 等 价 于 下 述 条 件 :对 任 
En 个 实数 Lila)” Lar 几乎 处 处 都 有 
户 (Zi Est En) = p (2) po Ta) stts pala) (3.2.4) 
| 其 中 pz; Las. nr) 为 (XI D CTU >. AE BEE p (11) » Pp2 (TX2) y... 
PY RAE n TAUREREKA AE A ERE LE A. FAX 
对 = 2 时 给 出 (3. 2.4) 与 (3. 2.2) 的 等 价 性 的 证 明 , 其 它 都 省 略 。 
4.2.2) RL, EI FC, y) = F(x)F,(y)，, 对 其 两 端 分 别 对 zx 和 yy 求 导 ， 
可 得 | 
Ty) = EA ) 一 Tate) 。 Taa? 
= pi) p: Cy) 
这 个 等 式 对 F M F 不 可 导 点 可 能 不 成 立 , 但 这 些 点 的 全 体 发 生 的 概率 为 零 ， 
这 意味 着 (3. 2. 4) 式 几 乎 处 处 成 立 。 反 之 , 若 (3. 2.4) 几乎 处 处 成 立 , 则 有 
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有 A a pp a A er rr 


Fiz, y) = 三 ["_p(=,ydzdy 
— | | 请 Crz)paC)dzady 


= | pdr: | pdy 
= F Cr) +» F,(y) 

BN CS. 2.2) 式 成 立 。 

例 3.2.2 (X,Y) ~ N(1,12,01,02,0) M] p=0X 5 Y 独立 的 充 
要 条 件 ,实际 上 当 2 王 0 时 ,二 维 正 态 联合 密度 函数 (3. 1. 5) 为 

pa) = lhe- [Ea y 902) 
= px(r)py(y) 

其 中 px(z) 和 ON TEX MY Ra a RAA 3. LD AX SY 独立, 这 
怠 是 充分 性 。 反 之, 耕 民 与 了 独立 , 则 对 一 切 过 与 了 应 有 bp(zyy) = 
Px py) HRE T = m,y = p WE past) = pyl) pyl) , HUA o 
一 0, 这 就 是 必要 性 ， | 

例 3.2.3 12(X,,X2,*"*",X,) RAEO Ma, pip) AP Pi 
0。 由 于 每 个 变量 X; 的 边缘 分 布 都 是 二 项 分 布 b(n,pi)( 见 例 3.1.4), 而 其 乘 
积 不 等 于 多 项 分 布 的 联合 概率 , 即 

PX = TI 入: = rN, = 2,) 
Æ P(X, = TI) 己 (X = 22), P(X, = £) 

FUERA SRA X X X, 不 相互 独立 。 这 个 结论 从 直观 上 看 是 
甚 为 明显 。 按 多 项 分 布 定义 应 有 天 +X: +e +X =n r>, WX 虽 不 
ELE — RE Az ;但 二 者 有 关 SM, Xy 取 n ET, X2,X3, 0“. yA, 都 只 能 取 0; 
3X Bn — 1i}, X: X, PREA — 1, HE HERO; X, 取 很 大 值 
时 ,X， 等 取 大 值 的 可 能 性 就 要 降低 .这 一 切 都 说 明 六 1, 和 2 EF ARA 
关系 ,它们 是 相依 的 随机 变量 。 

上 述 随 机 变量 独立 性 的 定义 3.2. 1 与 人 们 的 实际 经 验 是 一 致 的 .只 要 两 
个 随机 变量 间 没 有 任何 关系 ,就 可 确认 它们 是 相互 独立 的 .所 以 在 实际 中 , 往 
往 不 是 先 用 定义 3. 2. 1 来 验证 总 ,X，…, 生 ,的 独立 性 ,而 是 尽量 从 问题 的 实 
际 痛 景 来 判断 它们 之 间 的 取 值 有 无 影响 , 若 无 影 响 ,就 可 认定 XX, 0, X, 
是 相互 独立 的 。 然 后 再 由 定义 3. 2. 1 把 每 个 随机 变量 的 分 布 ( 可 以 是 已 (X = 
T) 或 户 (z) F) 连 乘 起 来 就 可 得 到 其 联合 分 布 ,从 而 可 以 计算 有 关 多 维 随机 
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dr sa ad aja r dhl ll Cl, AP PR PA UU oh pr - ne . - o - 


变量 的 事件 概率 .下 面 例子 可 说 明 独 立 性 的 应 用 ，。 
例 3.2.4 设 X 与 了 是 两 个 相互 独立 且 分 布 相同 的 随机 变量 。 其 共同 分 
布 由 下 列 密度 函数 给 出 
po = (5 HOKIA] 


0, 其 它 场合 
现 要 求 计算 P(X 十 Y 了 过 1)。 
解 : 要求 概率 P(X 十 Y 志 1), 必 和 需 先 知道 (X,Y 的 联合 分 布 ,如 今 已 知 X 
与 了 相互 独立 , 故 其 联合 密度 函数 为 


p(X,y) = p(x)ply) = 


于 是 要 求 的 概率 是 
PA+Y<1) = | plz, y)drdy 


(> 0OS<x,y< 1 
0 ， 其 它 


一 | 2z(1 一 z)zdz 一 二 
0 6 


3.2.2 随机 变量 函数 的 独立 性 

天 于 随机 变量 函数 的 独立 性 有 一 些 明 显 的 事实 , 现 罗列 如 下 。 

(1)X 与 了 是 二 个 相互 独立 的 随机 变量 , 则 f(X) 与 g(Y) 亦 相 互 独立 ,其 
中 f(.) 与 g(*) 是 二 个 函数 。 

壁 如 , 右 XX 与 Y 相 互 独立 , 则 XX 与 亦 相 互 独立 ,车 a 与 5 是 二 个 常数 ， 
Nj aX 十 6 与 e 相互 独立 , 若 和 与 了 Y 还 是 正 值 随 机 变量 , 则 lnX 与 InY 亦 相互 
独立 。 

(2) 常数 c 与 任 一 随机 变量 相互 独立 。 

(3) B Xise Xr Xrti Xn 是 个 相互 独立 的 随机 变量 ,其 中 1 二 7 一 
E 则 其 部 分 (XI y. ,X,) t (X, 9) Xp) 相互 独立 ,它们 的 函数 AX, ya, X,) 
与 ECX, 0) ) 亦 相 互 独立 。 | 

譬如 , 当 XXX 0 Xn 相互 独立 , 则 有 


二 (XI 十 … + X,) 与 一 一 CX, 十 … + XA) 相互 独立 ; 
Xi t ee +X S Xin + ee + Xi 相互 独立 ; 
EX, He + XO 与 CX2 十 … 十 X ERY. 
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3.2.3 ”最 大 值 与 最 小 值 的 分 布 

在 这 一 小 节 我 们 将 致力 于 寻求 若干 个 相互 独立 随机 变量 的 最 大 值 和 最 小 
值 的 分 布 ,为 此 我 们 首先 必须 明确 这 里 所 指 的 最 大 值 与 最 小 值 是 什么 ,然后 才 
能 去 寻求 其 分 布 。. 下 面 先 通过 一 个 简单 的 例子 来 说 明 。 

例 3.2.5 设 随机 变量 X, 5X 相互 独立 ,其 中 和 以 等 可 能 取 0 与 1 两 
T,X, 以 等 可 能 取 0,1,2 三 个 值 BARA.) XxX, 5 X, 的 分 布 分 别 为 


Xi 0 1 X: | 0 1 2 
P 1/2 1/2 P 1/3 1/3 1/3 


REX XD ARE O REA, EMULE G, j) i == 0,1, j = 0, 
1,2. 共 有 6 种 可 能 ,由 于 独立 性 的 假设 ,这 6 种 可 能 数 对 也 是 等 可 能 的 ,因为 
P(X, =1,X2= PY) =P(X, =5DP(X, = y) = 1/6 

这 两 个 随机 变量 X 5 X: 的 最 大 值 与 最 小 值 可 记 为 
Y =max(X,,X,), Z =min(X,,X,) 
每 当 X 取 值 i 时 ,X, 取 值 ; 时 ,Y 的 相应 取 值 为 max(i,7),Z 的 相应 取 值 为 
min(z,7)。 由 此 可 见 , 了 与 Z 都 是 Xi; 与 X: 的 函数 ,并 且 这 个 函数 不 能 用 初等 函 
数 表 示 。 求 它们 的 分 布 要 从 它们 各 自 的 定义 出 发 ,由 于 (Xi,X:) 的 取信 只 有 6 种 
可 能 ,我 们 把 它 罗 列 出 来 ,相应 Y 与 Z 的 取 值 也 可 罗列 出 来 , 详 见 表 3. 2. 1。 


表 3.2.1 (X,,X0,Y,Z 的 取 值 
(XI), X) Y 


N 


0 
0 
0 
l 
l 
l 


O = O N ku O 
OU me = Y me O 
b= j O O O O 


从 表 3. 2. 1 上 立刻 可 看 出 Y 只 可 能 取 0,1,2 三 值 ,Z 只 可 能 取 0,1 二 个 值 , 但 
都 不 是 等 可 能 ,而 是 如 下 分 布 


Y 0 1 2 Z 0 1 
P 1/6 3/6 2/6 P 2/3 1/3 
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这 样 我 们 就 求 得 了 最 大 值 了 与 最 小 值 Z 的 分 布 。 从 分 布 上 可 看 出 ,Y 与 和 是 不 
HFX 与 X; 的 两 个 新 的 分 布 ,相应 的 随机 变量 Y 与 Z 不 相互 独立 ,这 只 要 看 表 
3. 2. 1 的 第 一 行 就 可 看 出 ,该 表 第 一 行 意味 着 P(Y =0,Z = 二 0) =1/6, WP = 
0)P(Z = 0) = 1/6) X (2/3) = 1/9, 这 两 个 值 不 相等 就 破坏 了 独立 性 。 

寻求 若干 个 相互 独立 随机 变量 最 大 值 与 最 小 值 的 分 布 常 沉 是 对 连续 随机 
变量 进行 的 ,下 面 将 在 一 般 场 合 讨论 寻求 最 大 值 与 最 小 值 的 分 布 的 一 般 方法 ， 

EX XX 是 相互 独立 同 分 布 的 4 个 随机 变量 ,它们 共同 的 分 布 沙 
数 为 Fx(z) ,共同 的 密度 函数 为 py (zx), 现 要 寻求 它们 的 最 大 值 了 与 最 小 值 Z 
的 分 布 , 其 中 l 

Y = max(X Xz, Xn), Z=min(X,,X>,,*"",X,) 
先 考 察 了 的 分 布 函数 
Fy(y) =P Y < y) = P(max(X¡+X2+*""» XA.) <= y) 
其 中 事件 “max (Xy X23 X y? Fort TFK, S yX Syst An S 
y)” 因 为 n 个 随机 变量 的 最 大 值 不 超过 y 必 导致 其 中 每 一 个 都 不 超过 y; 反 之 ， 
千 nn 个 随机 变量 中 每 个 都 不 超过 y 必 导 致 其 最 大 值 不 超过 y, A E 
性 ,立即 可 得 
Fy(y) = P(A¡S< yX Ey < y) 
= P(X SPX: S y) P(X, <= y) 
= [Fx 
这 就 是 最 大 值 Y 的 分 布 函数 ,对 其 求 导 ,立即 可 得 Y 的 密度 函数 
Py) = nLFx(y) IT py) 
HSR Z 的 分 布 函数 
Fz(z) = P(X < z) = P(min(X X23, XÐ < 2) 
= ] — P(min(Xi X23, Xx) >z) 
= 1 — P(X, > z,X, >2,".,X, >z) 
= ] — P(X, > z)P(X, > z), P(X, > z) 
= ] — [1 — Fx(z) |" 
这 就 是 最 小 值 2 HAm HRS, 4 Z 的 密度 汞 数 
pz) =m[1 — Fx(z)] py tz) 

FOLLAR ,可 得 如 下 定理 。 

定理 3.2.1 设 和 ,XXX 是 2 个 相互 独立 同 分 布 随机 变量 , 玉 x(z) 
和 prr) 是 它们 的 分 布 函 数 与 密度 函数 , 则 其 最 大 值 Y = max (2Z) ,2,,… ,2,) 
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的 分 布 函数 与 密度 函数 分 别 为 


Fy(y) = [Fx] (3. 2. 5) 

byly) = nLFxC(y)] prO) (3. 2. 6) 
而 其 最 小 值 Z = min CX; ,六 ,…,X,) 的 分 布 函数 与 密度 画 数 分 别 为 

Fz(z) = 1 — [1 — Fx) (3.2. 7) 

pz(z) = m1 — Fx(z) | p, (2) (3. 2. 8) 


例 3.2.6 i Xi, X2, 0 Xn 为 n 个 相互 独立 、 且 都 服从 均匀 分 布 U(0,1) 
的 随机 变量 , 则 诸 X: 的 分 布 函 数 与 密度 了 淆 数 分 别 为 


l, E 
Po =de 0O<Xx<l pzz) = l> ocara] 
O, ¡ESE ; | 2» RE 
于 是 最 大 值 Y 与 最 小 值 Z 的 密度 函数 可 从 (3. 2.6) 和 (3. 2. 8) 获得 
py) = [r 0X<y<l 
0 ， 其 它 
Ca = 人 0Xzrz<l1 
0.00, 其 它 


不 难看 出 ,py(y) 是 贝塔 分 布 Beln,1) 的 密度 函数 ;pz(z) 是 贝塔 分 布 Be(l ,n) 
的 密度 函数 。 


3.2.4 FRA 

24 ENEE X SY HERA 0 AX Y HO RRE XA Y MDMA 
FIA RE A) ARA AMES AR XA 十 Y 的 分 布 都 各 有 一 个 简便 
的 卷 积 公式 ,下 面 我 们 来 叙述 它 。 

定理 3. 2. 2( 泊 松 分 布 的 卷 积 ) X~ PANDY ~ PCW), 且 站 与 Y 独 
ZM] X +Y ~ PA +à). 

这 个 定理 告诉 我 们 ,两 个 相互 独立 的 泊 松 变量 之 和 仍 为 泊 松 变量 。 

证 :由 于 泊 松 变量 XX 与 Y 可 取 所 有 非 负 整数 , 故 其 和 六 十 了 也 只 可 取 所 有 
非 负 整数 。 因 为 对 任 一 非 负 整数 &, 事 件 “X 十 了 三 有 "可 以 写成 如 下 & 十 1 个 互 
不 相 容 事件 之 并 : 

“X = 0,Y =2”,“X =1,Y =k-—1”,*",“X = k,Y = 0” 

考虑 到 独立 性 ,可 得 


k 
P(X + Y =k) = > P(X =i,Y =k — i) 
i=0 
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一 PPX =-DPG =i (3. 2. 9) 
这 就 是 离散 形式 的 卷 积 公式 ,把 泊 松 概率 代入 上 式 , 可 得 


A à Àz —A 
PX+Y =D = Dlh) ms’ 
k k! ele (4, +4) 
y > i | Ck A ) k) 
由 于 上 式 中 的 括号 内 的 量 怡 好 等 于 (4 + A), HA 
PX 十 了 一 大 ) 一 + a, 
AMEZAA A 十 WARIH, B AX + Y~ POA H A). 
在 概率 论 中 把 寻求 独立 随机 变量 和 的 分 布 的 运算 称 为 卷 积 运算 ,并 以 符 
号 “< ”表示 。 上 述 结果 可 表示 为 
P(A) x< P (Àz) — PCA, + Àz) (3. 2. 10) 
这 一 简明 表示 便于 我 们 推广 。 壁 如 三 个 相互 独立 的 泊 松 变量 之 和 的 分 布 为 
PD X P) X PA) = PA + À + À) 
又 如 个 独立 同 分 布 的 泊 松 变量 之 和 的 分 布 为 


PA) X POA) X x POA) = P (nà) 
AN XE Xe X PA 
A (3. 2.11) 
ni 


k = 0,1l,°% 


这 些 结果 是 很 容易 看 出 的 。 

定理 3.2. 3( 二 项 分 布 的 卷 积 ) ” 设 X~6bln,p),Y ~blm,p), 且 XX 与 Y 
MOL, X + Y —b(n +m,p), o 

这 个 定理 告诉 我 们 ,成 功 概率 p 相同 的 两 个 相互 独立 的 二 项 变量 之 和 仍 
为 二 项 变量 ， 

证 :由 于 X 可 有 取 0,1, -,2 HJE , Y 可 取 0,1,"-,m HJ IE, ix X + Y HU O, 
1,…,n 十 m 的 值 .再 用 卷 积 公式 (3. 2.9) 可 得 


k 
P(X +Y =k) = > P(X = DPY =k —i) 
¡=0 
k 
n 
=>; 
pak 


p'(lC— pl, "e Jea — pros | 


A JJe (1 一 p) t” 


应 用 组 合 恒等式 
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n+ m 
k 


PAS 


> 


可 得 


P(X + Y -一 k) => #a py! 


n -+ ”| 
k 
这 就 是 二 项 分 布 5(n 十 m,p) ,其 结果 可 用 如 下 卷 积 公式 表示 
bín,p) X bm,p) = bin+m,p) (3.2.11) 
要 注意 的 是 ,两 个 二 项 分 布 中 的 成 功 概 率 六 要 相同 ,否则 上 述 卷 积 公 式 不 成 
ZAE p 起 着 单位 尺度 的 作用 ,两 个 单位 尺度 相同 的 变量 才 可 以 相 加 。 
容易 看 出 ,上 述 结果 可 以 推广 到 有 限 个 二 项 分 布 场合 。 辟 如 ,n 个 相互 独 
立 的 二 点 分 布 5b(1,p) 的 卷 积 为 
DCI) X bl,p) X Xx 0(1,p) = bn,p) 
n 个 (3. 2. 12) 
ARA: AIT n 次 独立 贝 努 里 试验 , 记 X; 为 第 i 次 贝 努 里 试验 中 成 功 出 现 的 
次 数 ( 非 0 妈 1),X 为 成 功 出 现 的 总 次 数 , 则 X 是 个 相互 独立 随机 变量 X, 
Xara LABI X = X H X e 十 XX,。 类 似 地 可 把 服从 二 项 分 布 bCm， 
H) 的 随机 变量 了 进行 分 解 ,可 得 了 == 六 十 Yi 十 … 十 Ym, 其 中 Yj; 是 m 次 独 
立 贝 努 里 试验 的 第 j 次 中 成 功 出 现 的 次 数 。 当 义 与 了 独立 时 ,六 1 XX, 5 
Yi ar Y 亦 相 互 独立 ,从 而 XA +Y 可 看 作 n 十 m 次 独立 贝 努 里 试验 中 成 
功 出 现 的 次 数 , 故 羡 十 Y~bln 十 mp)。 
在 连续 随机 变量 场合 ,寻求 独立 随机 变量 和 的 密度 函数 有 如 下 的 一 个 连 
续 形 式 卷 积 公 式 : 
定理 3. 2. 4( 卷 积 公式 ) 设 蕊 汝 YY 为 两 个 相互 独立 的 连续 随机 变量 ,其 
密度 函数 分 别 为 pxCz) 和 py(y), 则 其 和 2Z = X 十 Y 的 密度 函数 为 


pz(z) 一 | PrE — Ps (3. 2. 13) 
证 :Z = X + Y PIRATA 
F(z) = P(X +Y<Sz) = | Pxtx)py(yixd y 


ad yZx 


= | | | Ps (edz | py (y)dy 


= | Fx — pr(dy 
其 中 Fx 为 和 的 分 布 函数 .对 上 式 求 导 ,可 得 Z 的 密度 函数 
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pato = | ¿Pre ydy 


= | px — y)py (y)dy 

这 就 是 连续 随机 变量 场合 下 的 卷 积 公式 (3. 2.13). 

和 下面 对 正 态 分 布 和 伽 玛 分 布 使 用 这 个 公式 。 

定理 3. 2. S( 正 态 分 布 的 疮 积 ) EX ~ Nm), Y ~ Ním,oD, HX 
E Y Maiz, X +Y ~ Ne 十 mo +0), 

证 :由 于 X 与 了 都 在 整个 实数 轴 上 取 值 , 故 其 和 2Z 二 XX 十 了 也 在 整个 实 
数 轴 上 取 值 .利用 卷 积 公式 (3. 2.13) 可 得 Z 的 密度 函数 。 按 卷 积 公式 应 先 把 X 
HI E BERS pe) 中 的 xz 用 z 一 y 代 替 , 而 7 的 密度 函数 py(y) 不 变 ,代入 卷 
积 公 式 后 , 即 得 


co — — 2 
P.(z) = | | exp | 一 EA — =r JE 


N 270, 207 
1 | (y 一 m) | 
exD 一 一 一 一 一 | | 7 
| N ZRO, P 20; 7 
o _ 1 rf” Ife y— A) (Y 一 49) | 
2X010, | ”exp|— 2 | 20? + 20? | dy 


经 过 一 些 代 数 运算 ,不 难得 到 
_ _ 2 _ 2 _ _ 2 2 
(z y 41) + (y 12) — (y CI L) + Al » o A 


oi 0% dí +0 
1 1 _ 2 Ay Po 
A= o$ + a” B a + g? 
代 回 原 式 , 可 得 
了 (z — Aa — po) | 
paz) 20,0, p| 2 o? 十 o? 


[e 70 Pe 
利用 正 态 分 布 性 质 ,上 式 中 的 积分 等 于 (2x/4)z。 于 是 
-一 一 一 一 |- 3 o L & — A =a | 
Sn » |a +o? 2 07 十 0; 

(— œ <z < o0) 
这 正 是 均值 为 内 十 pw, 方差 为 5 十 0 的 正 态 分 布 。. 这 表明 :两 个 独立 的 正 态 恋 
量 之 和 仍 为 正 态 变量 ,其 参数 对 应 相 加 , 即 
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pzz) 一 


"OVA AAA DO MAITE E ASE a rn Ep TE re re eya. 


N(1 +00 x Nai) = Na + 12,01 + 0%) (3. 2.14) 

这 一 简明 表示 便于 我 们 推广 上 述 结果 。 璧 如 三 个 相互 独立 的 正 态 变 量 之 和 的 
分 布 为 

N (41,01) * N(1,,07) * N(p3,03) = N C + Mo + 3,01 + 07 + 05) 

B13.2.7 设 X,X:,…,X, 为 相互 独立 同 分 布 的 正 态 变量 ,其 共同 分 布 
为 NW(po2) , 现 要 求 其 算术 平均 数 和 一 (X, + X: + ee + Xd 的 分 布 。 

解 : 由 正 态 分 布 的 着 积 公 式 可 知 

Xi + X Hee t Xa, ~ N(np,no”) 

骨 利 用 正 态 变量 的 线性 变换 (见习 题 2. 3. 13) 可 知 


X= AX +X 十 十 X,) ~ N| LE 
由 此 可 见 RAFA X TRAE ROA EAS X, 的 均值 x 相间 ,但 


其 方差 缩小 了 ” 倍 ,为 oz/m, 其 标准 差 缩小 了 /z 倍 ,为 o/ /元 RX H 
分 布 更 显 集中 趋势 ,图 3. 2. 1 示意 了 这 种 变化 。 


3.2.1 No) 51, E) 的 密度 曲线 


定理 3. 2. 6( 伽 玛 分 布 的 卷 积 ) 设 和 一 Gaka A), Y ~Gala,, D,BX5 
Y MIL, MW] X + Y ~ Gala, + 9,,2). 

证 :由 于 和 与 了 的 取 值 均 为 正 实数 ,其 和 的 取 值 也 为 正 实数 . 故 当 > 委 0 
时 ,有 zz(z) 一 0; 而 当 z 盖 0 时 ,可 应 用 卷 积 公式 (3. 2. 13) 要 使 被 积 函数 pe 
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一 力 p(y)>0, 必 须 z 一 y 盖 0 和 yy 盖 0 同时 成 立 , 这 就 意味 着 积分 变量 y 应 
Ps(z) = (pa — y) (y dy 
— F AA _ 4a] 一 | p a, a ay" 
AS yate lay: < ¡dy 
Att 


AMA y — Zu ;dy 一 zdu, ERRI EJI NA I Ep 


z 1 
Ô 0 


一 ya 7271 Pla D (as) 
Plai + az) 
代 回 原 式 即 得 
pz(z) = Fe tale z>0 
这 是 形状 参数 为 ai 十 a;、 尺 度 参数 仍 为 4 的 本 分 布 .这 个 结果 可 表示 为 
Ga (ai À) * Galaz, A) = 一 一 Ga (a; + az, A) (3. Ze 15) 


ARM | RES BORA ARA EL AE ZAIDA MA, EJER 
HHITAE BLA, RESALTA APA IL 0) 10 45 
量 之 和 就 没有 上 述 简明 结果 ,这 很 像 单位 不 同 不 宜 相 加 一 样 。 

上 述 结 果 可 以 推广 到 有 限 个 向 玛 变量 场合 .譬如 ,有 

Ga(1,4) x* Ga(1,4) x -+ * Ga(1,4) = Gaíln,A) (3.2.16) 
其 中 Ce(1,4) 是 参数 为 和 的 指数 分 布 。 上 式 表 明 :参数 相同 的 ”个 相互 独立 的 
指数 变量 之 和 仍 是 仰 玛 变量 ,其 形状 参数 为 z, 尺 度 参 数 不 变 。 

例 3. 2.80 分 布 的 由 来 ) 设 XXX 是 nn 个 相互 独立 、 同 分 布 的 
随机 变量 ,其 共同 分 布 为 标准 正 态 分 布 NC0,1), 则 Y =X? +X 十 … + X2 BH 
从 目 由 度 为 nn 的 义 分 布 , 记 为 xX(n)。 下 面 来 导出 XX 分布 的 密度 函数 。 

解 :首先 求 Z = X? 的 分 布 .由 于 Z 非 负 , 故 当 z 世 0 时 ,P(Z <z) =0,M 
当 z 0 时, 则 2 的 分 布 函数 为 

PIS) =pMXi<22)=PCYVz2S<X, <vVz>) 
= Fx(Vz)— Fx(—Mez) 
对 z 求 导数 ,得 Z 的 密度 函数 


pz(z) = wz Pp VE) + px Vz) 
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其 中 px (z) = (Va exp(— 2/2) 为 标准 正 态 密度 函数 .代入 上 式 ,可 得 


A _ 
1 r 2e 2/2 ， z>0 


Pz(x) = | 2 


O, z< 0 


这 正 是 伽 玛 分 布 Ga| LL) AR eL HMDA. 
由 于 Xy ¡AA 独立 同 分 布 , 故 Xis Xz, “e, Xa DALA, A 


共 分 布 为 Ga| LL) ,再 由 伽 玛 分 布 的 卷 积 公式 (3. 2. 11) TEL = X 十 X 
al REE A) RE ERRA LA. 3. 30) 式 ) 


十 … 十 Xi 的 分 布 Ga 


- y2 le”, y > 0 
pr(y) =P TO 
0， yso 
X 分 布 中 的 唯一 参数 n 就 是 独立 正 态 变量 个 数 , 故 称 n 为 自由 度 ， 


$33 多维 随 机 变量 的 特征 数 


3.3.1 多 维 随机 变量 函数 的 数学 期 望 
在 $2.4.1 中 ,我 们 曾 给 出 一 维 随机 变量 函数 的 数学 期 望 的 计算 公式 
(2. 4. .在 那里 用 一 维 随机 变量 X 的 分 布 就 算得 其 函数 g(X) 的 数学 期 望 。 
如 分 有 了 多 维 随机 变量 的 分 布 ,就 可 把 公式 (2. 4.2) 推广 到 多 维 场合 ,为 叙述 
方便 ,下 面 仅 对 二 维 随机 变量 给 出 计算 公式 ,读者 不 难 把 它 推广 到 三 维 或 更 高 
维 场合 ,而 以 下 所 涉及 的 数学 期 望都 假设 存在 。 
定理 3.3.1 设 (X,Y) 是 二 维 随机 变量 , 则 其 函数 g(X,Y) 的 数学 期 望 为 


>, 之 18 sy PX = T; Y = Y), 
X,Y) 为 二 变 
prnl, LA ASARKEN 。。，， 
np ydrdy, 


当 (X, 了 ) 为 二 维 连续 随机 变量 
其 中 P(X — Lis Y = y), 1 = 1,2, ,] = 1,2,+.** 为 二 维 离散 分 布 ,如 (zy) 为 
二 维 联合 密度 函数 。 
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这 个 定理 的 证 明 超出 本 书 范围 , 故 省 略 , 下 面 看 它 的 两 个 特殊 场合 。 
(1) 当 g(X,Y) = X, 则 在 二 维 连 续 随 机 变量 场合 有 


E(X) = B | aptzx,ydad y 


= ¡NE e (X,Yy)dy )dz 


== | _zprGz)az 


其 中 ,py(z) 是 XX 的 边缘 密度 也 数 ,这 表明 :分量 X 的 数学 期 望 就 是 用 边缘 分 
布 算得 的 数学 期 望 , 这 个 性 质 对 分 量 Y 也 成 立 ,在 离散 场合 也 成 立 。 
(2) 4 g(X,Y) = (X 一 &X)，, 则 在 二 维 连 续 随机 变量 场合 有 


E(X — EX) = | | (x — EX Yptlz,ydxd y 


一 | (x — EXYp, (x)dz = Var(X) 


这 表明 :分量 天 的 方差 就 是 用 其 边缘 分 布 zx(z) 算 得 的 方差 .这 一 性 质 对 分 量 
Y 也 成 立 , 在 离散 场合 也 成 立 。 

从 以 上 两 个 特殊 场合 看 出 ,多维 随机 变量 各 分 量 的 期 望 与 方差 都 可 用 各 
目 边 缘分 布 算得 ,但 要 求 E(X +Y) 与 EC(XY) 之 类 的 期 望 还 得 用 联合 分 布 ， 


例 3.3.1 设 二 维 连续 随机 变量 (X,Y) 的 联合 密度 函数 为 
12y*, MO<y<IS< 1 
p(z,y) == as 
0, 其 它 场 合 
试 求 E(X 十 Y) ,E(XY), EC(X),E(Y), Var(X),Var(Y), 
解 : (1) REX 十 Y)。 令 8(X 十 Y) 一生 十 了 ,由 (3. 3.1) 式 可 得 
E(X +Y) 一 | a + y) *12yYdydx 
O 0 
= [7ztaz =L 
0 5 
(2) K EC(XY), 4 g(X,Y) = 二 XY, 由 (C3.3.1) 式 可 得 


1 rz 
ECXY) = | [y «12vdydx 


F 


1 
一 | zdz 一 7 
(3) RECO MED 。 先 求 出 总 与 了 的 边缘 密度 函数 
p(z) 一 [12y%a) =4x*, 0<1r<1 
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Fa 1 a a PRA e A AT e a aa -ur 


p(y) = | 12yaz 一 124 — y), 0S y < 1 
其 它 场合 下 py(z) 与 py(y) 均 为 零 , 利 用 上 述 边 缘分 布 可 算得 


1 
E(X) = |z: . Arda = 全 


E(Y) = E -122 (1 — y)dy = A 
0 


(4) 最 后 求 Var(X) 和 Var(Y) .利用 上 述 边 缘分 布 先 算得 


1 
E(X») = | xz? 。 dridz 一 A 
0 
2 
E(Y?) = | y Red — ydy = < 
0 


由 此 可 得 


3.3.2 ”数学 期 望 与 方差 的 运算 性 质 
在 》2.4. 1 中 曾 给 出 一 个 随机 变量 的 数学 期 望 与 方差 的 性 质 , 这 里 再 给 


出 三 条 性 质 ,它们 涉及 多 个 随机 变量 的 数学 期 望 与 方差 。 
定理 3.3.2 设 (X,7) 为 二 维 随机 变量 , 则 有 
ECX + Y) = E(X) + EC) (3.3. 2) 


证 :在 连续 场合 ,在 (3. 3. 1) 式 中 令 g(X,Y) = X + Y UA 
EX+4D=|_ | (+yp(2,9dzdy 


= | | plz» ydrdy + | | ?DTYyD)GCZCY 


一 ["_apxadaz + yPy (y dy 
= E(X) + EC(Y) 


在 离散 场合 亦 可 类 似 证 得 。 

这 个 性 质 可 以 简单 叙述 为 < 和 的 期 望 等 于 期 望 的 和 ”。 这 个 性 质 还 可 推广 
到 个 随机 变量 场合 , 即 

EA + X: Ho +H XDS EXD HEX) +" +E(X,)) (3.3.3) 


定理 3.3.3 设 (X,7) 为 二 维 独立 随机 变量 , 则 有 
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A A ep er a a 


ECXY) = EC(X)ECY) 
证 ;在 连续 场合 ， 由 X GE Y MATH p(z, y) = p(z) py (y) ,在 (3. 3.1) 式 
HS g(X,Y) = XY, WA 
E(XY) = | 


a 


| xayptla,yWxud y 


= | | _zypxCc)prC)dzay 


一 | zzpxGz)dz 。 | __ypy (dy 
= E(X)E(Y) (3.3. 4) 
在 离散 场合 亦 要 类 似 证 得 。 
这 个 性 质 可 以 叙述 为 “独立 随机 变量 积 的 期 望 等 于 期 望 之 积 ”, 在 这 里 独 


立 性 条 件 是 不 能 忽略 的 ,在 例 3.3.1 中 ,有 ECX)ECY) = É x $ = 12/25 # 


1/2 = E(XY), 即 定理 3. 3. 3 不成立。 这 是 因为 例 3. 3. 1 中 定义 的 二 个 随机 变 
量 X 与 Y 不 独立 , 即 po) Æ pra) pyy) ABRE 3.3.1 中 ,定理 3. 3.2 是 
HAM) ECO + EY) =7/5= E(X 十 Y)。 这 是 因为 定理 3. 3. 2 没有 独立 性 
的 要 求 , 它 在 任意 场合 都 成 立 。 

定理 3. 3. 3 也 可 推广 到 个 独立 随机 变量 X XXn 场合 , 即 


E(XIX, Xn) = ECXADE(X II “E(XD. (3.3.5) 
EH 3.3.4 EX, Y) 为 二 维 独 立 随 机 变量 , 则 有 
Var(X + Y) = Var(X) + Va (YD, (3.3.6) 
证 :由 方差 定义 可 知 


Var(X + Y) = E[(X + Y)— E(X +Y)! 
= E[(X — EX) + (Y — EY) } 
= E(X — EX) + E(Y — EY? 
+ 2E[(X — EX) — EY) ] 
由 XX 与 Y HERM X — EX 5 Y 一 EY 也 相互 独立 ,由 定理 3.3.3 知 
E[(X — EXX(Y — EY)] = E(X — EXDE(Y — EY) = 0 
代入 原 式 , 即 得 (3. 3. 6) 式 。 
这 个 性 质 也 可 和 叙述 为 “独立 随机 变量 和 的 方差 等 于 方差 之 和 ”, 这 个 性 质 
也 可 推广 到 个 独立 随机 变量 XX +0, Xn 场合 , 即 
Var(X; £X: +“ X.) = Var(X) + Var(X,) +° +Var(X,) (3.3.7) 
13.3.2 12X,,X2,X3 为 相互 独立 随机 变量 ,它们 的 期 望 依次 为 10,4， 
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7, 它 们 的 标准 差 依次 为 331,2. HER Y = 2X + 7X, 一 3Xs WHA JES 
标准 差 。 
解 :应 用 定理 3. 3. 2 0148 Y 的 期 望 
EY = 2E(X1) + 7E(X,) — 3E(X3) 
| =2X10+7X4-—3X7=27 
应 用 定理 3. 3. 4 0148 Y 的 方差 与 标准 差 
Var(Y) = 4Var(X ¡> + 49Var(X,) + 9Var(X;,) 
=4 X 3f + 49X1? +9x 2? = 12] 
z(Y) = M121 = 11 
03.3.3 试 求 自由 度 为 ”的 x 变量 的 数学 期 望 与 方差 。 
解 :由 例 3.2.8 知 ,X: = X? 十 XX 十 … 十 X?, 其 中 诸 X; 相 互 独立 , 且 盘 为 
标准 正 态 变量 。 由 例 2.5.1 知 
EXi=1, EXií=3, Var(X3) 一 2 
从 而 可 得 
EGO = EXD+E(XD + e + E(X) =n 
Var(X) = Var(X?) + Var(X?) + + Var(X?) = 2n 
可 见 ,x 变量 的 数学 期 望 就 是 其 自由 度 ,方差 是 其 自由 度 的 二 倍 。 


3.3.3 ” 协 方差 

前 面 讨论 的 多 维 随机 变量 的 数学 期 望 与 方差 只 利用 其 边缘 分 布 所 提供 的 
信息 ,没有 涉及 诸 个 分 量 之 间 关 系 的 信息 。 这 里 将 提出 一 个 新 的 特征 数 
协 方差 , 它 将 能 反映 多 维 随机 变量 各 分 量 间 的 关系 ,在 讨论 了 协 方差 性 质 后 ， 
我 们 将 给 出 若干 个 随机 变量 和 的 方差 计算 公式 。 

定义 3.3.1 设 (X,Y) 为 二 维 随 机 变量 , 它 的 二 个 方差 都 存在 , 则 称 
E (X — EX)(Y 一 有 7Y)] 为 和 与 了 的 协 方差 或 相关 矩 , 记 为 

Cov(X,Y) = E[ (X — EX) — EY)] (3. 3. 8) 

从 这 个 定义 可 以 看 出 ,X E Y MUTTER X RX — EX) 与 了 的 偏 
EOY 一 EY) REPATHA. h FRET (A thy Cov(X,Y) HE 
可 负 , 也 可 以 为 零 ,定义 中 要 求 两 个 方差 存在 ,是 为 了 保证 协 方差 存在 。 

下 面 我 们 来 研究 协 方 差 的 运算 性 质 ， 

定理 3.3.5 设 XX 与 了 的 协 方差 为 Cov(X,Y) 

(1)Cov(X,7) 5 X,Y 的 次 序 无 关 , 即 
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Cov(X,Y) = Cov(Y,X) 
(2ICoví(X,Y) = ECXY) — E(X)E(Y); (3.3. 9) 
(3) Æ X 5Y Maz, Cov(X,Y) =0, 
YE: (D 可 从 定义 3.3.1 看 出 ,(2) 可 从 定义 3.3.1 推出 
Cov(X,Y) = E[(X — EX) — EY)] 
= E[XY 一 XEY — YEX + EX + EY] 
= E(XY) — EXEY 一 EXEY + EXEY 
= E(XY) — EXEY 
E X EY 独立 ,E(XY) = EXEY,AmM4 Cov(X,Y) = 0, 即 (3) 成 立 。 
例 3.3.4 设 随 机 癌 量 (X,Y) HURE BA BON 
bla, y) = 3T, 0O<y<axi<l 
0, 其 它 
现 要 求 协 方差 Cov (和 ,7 ) 。 
解 :从 p(z,y) 的 定义 域 可 以 看 出 ,虽然 z 与 y 都 在 0 与 1 之 间 , 但 y 要 小 
于 X, 或 工 要 大 于 y, 而 xz 与 y 分 别 是 随机 变量 对 与 了 的 取 值 ,所 以 了 的 取 值 总 
NF X ØRE XE X 与 了 不 会 是 相互 独立 的 ,其 相关 程度 要 看 协 方差 的 
大 小 ,为 计算 Co A O ,我 们 需要 ECXY),E(X),E(Y) 等 值 。 


1 I 
E(XY) = | | xy * 3xdydr 
0 Q 


1 fz . 
E(X) = | | = e 3xadydx 


= 34 LT = - 

1 r 
EY) =Í | y » 3zdydx 
0 0 
2 
= 32 gar = A 
最 后 , 按 (3. 3. 8) 式 我 们 得 到 
Cox. N=2-2x2-359 


10 4 8 160 o 
AS AS AE EA 
之 间 相 关 程 度 不 会 很 大 。 
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EH 3.3.6 W Var(X) = 0%,Var(Y) = 0%, MA 
[Cov(X,Y) P < oko} (3. 3. 10) 
WE: Ri o > 0. AAA ok = 08, ME 2. 4.9 知 ,和 几乎 处 处 为 常数 ， 
而 常数 与 了 的 协 方差 必 为 零 ,这 意味 着 (3. 3. 10) 式 两 端 丝 为 零 , 故 (3. 3. 10) 
ARL. Æ o 0 成 立 下 ,考虑 i 的 如 下 二 次 函数 ， 
E(X — EX) + (Y — EY) Y = tok + 21Cov(X,Y) + 0% 
上 述 守 的 二 次 三 项 式 非 负 , 平 方 项 系数 ox 为 正 , 则 其 判别 式 非 正 , 即 
[2Cov(X;Y) 1? — 4007 < 0 
移 项 后 即 得 (3. 3.10. 
最 后 ,给 出 随机 变量 和 的 方差 计算 公式 ,所 涉及 的 方差 都 假设 存在 。 
定理 3.3.7 对 任意 二 维 随机 变量 (和 ,7), 有 Var(X + Y) = Var(X) + 
Var(Y) + 2Cov(X, Y), 
证 :由 方差 定义 知 
Var(X + Y) = E[(X + Y) -E(X+Y)>] 
= E[ (X — EX) + (Y — EY)] 
= Var(X) + Var Y) + 2Cov(X,Y) 
从 这 个 性 质 可 以 看 出 MX 5 YAH}, Cov(X,Y) =0, MM (3. 3.11) MH 
退化 为 独立 随机 变量 和 的 方差 公式 (3. 3. 6) .这 个 性 质 可 以 推广 到 任意 有 限 个 
场合 , 即 


Var (IX = D Var(X) +2 24 ZCX Y») 


(3. 3. 12) 
这 个 一 般 公 式 的 证 明 类 似 于 (13. 3.11) 式 的 证 明 。 
03.3.5 设 二 维 连 续 随机 变量 (X,Y) 的 联合 密度 函数 为 
(z+y)， 当 0<z<1,0<y<2 
0， 其 它 场合 
试 计算 Var(2X 一 3Y + 8), 
Var(2X — 3Y + 8) = Var(2X) + Var(3Y) — 2Cov(2X,3Y) 
= 4Var(X) 十 9Var(Y) — 12Cov(X,Y) 
为 了 计算 上 述 方差 与 协 方差 ,需要 先 计 算 EX ,EX?,EY ,EY? 和 EXY ,为 此 先 
计算 X 的 边缘 分 布 。 


plr,y) -| 
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p(X) = [3 ls + y)dy = (a+ 1), 0<<1 


由 此 可 算得 EX 一 5/9,EX? = 7/8, Mí Var(X) 一 13/162。 类 似 可 算得 了 的 
边缘 分 布 


o 一 | + nda 34)» 0<y<2 
由 此 又 可 算得 Ey 一 11/9， EY? 一 16/9, 从 而 Var(Y) = 23/81。 最 后 我 们 来 计算 
EXY 一 5 T zy(x ydydr 


_1lf..., 8 _ 2 
= | Qe + ¿oda = 3 


于 是 可 得 协 方差 
_2_ 2, 1__ 1 
Cov(X,Y) = 3 o x 9 一 一 大 
代 回 原 式 ,可 得 
DEORE] 23 _ 1) _ 245 
VarQAX — 3Y + 8) = 4 Xi 十 9X 12 X | — 2] 81 == 3 


例 3. 3. 6( 配 对 问题 ) 有 个 人 ,每 人 将 自己 的 礼品 扔 入 同一 箱 中 ,把 礼 
品 充分 混合 后 ,每 人 再 随机 从 中 选取 一 个 , 试 求 选中 自己 礼品 的 人 数 XX 的 期 


望 值 与 方差 
a 1, 当 第 z 个 人 恰好 取出 自己 礼品 O 
解 : 设 。X, 二 | 0, 第 i 个 人 取出 别人 的 礼品 TDU 


这 个 随机 变量 是 同 分 布 的 ,其 共同 分 布 为 


(===, pX=0=1-2, 1 =1,2,"",2n 
所 以 其 期 望 与 方差 分 别 为 
E(X;) 一 工 ， Var(X;) = 1 l 一 L] 9 z = 1,2,.* ,7 
n n n 


在 上 述 假设 下 n 个 人 中 选中 自己 礼品 的 人 数 A 
X=X,+X + +X, 
故 


EX) 一 E(X) + E(X) + + EX) 一 2 一 一 1 


印 平均 地 说 ,它们 当中 仅 有 一 人 能 选中 自己 的 礼品 。 
A AMIA X 间 不 是 独立 的 ,所 以 拒 的 方差 为 
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Var(X) = > Var(X) 十 2 >, >,Cov(X;,X,) 
¿=] iZ] 
为 计算 Cov(X X) RIKER XX HAX: 


Xy 二 MN 当 第 i 和 第 j 个 人 都 恰好 取出 各 目的 礼品 


0， 其 它 场合 
于 是 
E(X¡X ) 一 P(X; 一 1,X, = 1) 
= P(X = DPX; =11X,= D = += 
因此 
(1 
ov 一 
由 此 可 得 
Var(X) =n rs 1 


由 此 可 见 , 在 配对 问题 中 ISI 1, 而 与 参与 人 数 n 无 


3.3.4 ”相关 系数 

两 个 随机 变量 之 间 的 关系 可 分 为 独立 和 相依 ( 即 不 独立 ) ,在 相依 中 又 可 
分 为 线性 相依 和 非 线 性 相依 ,由 于 非 线 性 相依 种 类 繁多 ,至 今 尚 无 实用 指标 来 
区 分 他 们 ,但 线性 相依 程度 可 用 线性 相关 系数 来 刻 划 ， 这 一 段 将 研究 刻 划 两 个 
变量 之 间 线 性 相依 程度 的 特征 数 。 

定义 3.3.2 设 (X,7) 为 二 维 随 机 变量 , 它 的 两 个 方差 04 WM o 都 存在 ， 
且 都 为 正 , 则 称 Cov(X,Y)/oxoy H X E Y 的 线性 相关 系数 ,简称 相关 系数 , 记 
为 : : 


Corr(X,Y) = AV) (3.3.13) 


Oxy 
它 与 协 方差 同 符号 , 当 Corr(X, Y) > 0, PR X E Y 间 为 正 相 关 ; 当 Corr(X,Y) 
<O0 RX BY ADAX; 4 Cor(X,Y) =0, X 5Y 不 相关 ， 
513.37 设 随机 向 量 (X,Y) 的 联合 密度 函数 为 
3T, 0<y<zxi<l 
(T, ) = 
PACED, o. 其 它 
现 要 求 相 关系 数 Corr (X,Y)，。 / 
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解 :这 个 例子 曾 在 例 3. 3. 4 中 作 过 讨论 ,在 那里 曾 获 得 协 方差 Cov (X,Y) 
= 3/160 MAMAH E(X) = 3/4,E(Y) = 3/8。 为 完成 计算 尚 需 计 算 E(X?) 
M EY). CRITA py) 直接 获得 


| ix 1 
E(X?) = | | « 3zdydz = | 32 . zdz = Š 
oo . 0 9 
l1 fy 1 r? ] 
EY’) = | [y .3ydydr = | 3x + Edr = + 
0J o 0 3 5 


HIER X 5 Y AZ 


3 (3 3 
Var(X) = 5 3) = z0 70 0375 
- 工 -|3| -P 
Var(Y) = 5 g) 32 = 0, 0594 
最 后 得 到 X 与 Y 的 相关 系数 
Corr(X,Y) = _ 3/160 _ 一 NE: = 0. 3973 
3 X 19 
80 X 320 


这 个 相关 系数 近似 0. 4, 不 算 很 小 ,说 明 X 与 了 有 一 定 程度 的 相关 ,而 相 
应 的 协 方差 Cov(X,Y) = 3/160 = 0. 0188 是 很 小 的 。 若 从 协 方差 上 看 , 飞 与 了 
间 的 相关 性 是 很 微弱 的 ,几乎 可 忽略 不 计 , 此 种 错觉 是 由 于 没有 考察 方差 , 若 
两 个 方差 都 很 小 (如 这 个 例子 那样 ,分 别 为 0.0375 和 0. 0594) ,即使 协 方差 小 
一 些 , 相 关系 数 也 能 显示 出 一 乍 程度 的 相关 性 。 由 此 可 见 , 在 协 方差 的 基础 上 
加 工 形成 的 相关 系数 是 更 为 重要 的 相关 性 的 特征 数 。 

例 3. 3. 8( 二 维 正 态 分 布 的 相关 系数 ) 设 (X,Y) ~ N (pm , 12,101,070) , 
现在 来 验证 :二 维 正 态 分 布 中 的 第 五 个 参数 p 不 是 别 的 , 正 是 了 与 Y 的 相关 系 
2% , BN Corr(X,Y) = p, 

验证 :关键 是 要 算得 协 方差 ,由 二 维 正 态 联合 密度 函数 (3.1.15) 可 知 

Cov(X,Y) = E[ (X — 4) (Y — m)] 


| IG 
2010, M1 — p2 J-= Jo 


a dl [GA E Y A) 
exp| 2(1 — | of 2p 9,0» 


_ 2 
十 Ly — pa) 42 Jazdy 
2 


注意 上 式 中 方 括号 内 的 量 
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A aa a 


Oi 010 o$ 
之 一 y NT Y PK í 
— Ao + | i 一 pi | 
O, O O, 
(FEE PRA 
y — 1 LI 一 My pr) 
y 一 y — Pp 
Oz 
由 此 可 得 
— 4 = ofu v 1 — # + ov] 
Y — Pz — 020 
dad y -一 010» N 1 — dudu 
从 而 


Cov(X Y) = aaf | [uv VI — # + pw]e Lat do 
EXAMEBRII AER ,其 中 
PO vent dudo = f ueida - verde =0 
| | pett dudv =f edu. |" vedu = 2x 
代 回 原 式 , 即 得 


na 


Cov(X,Y) = * 0 » 2% = 0,0, 
Corr(X,Y) = CO 
3,0, 


TL ORESH 中 第 五 个 参数 p 不 是 别 的 , 正 是 其 相关 系数 。 
下 面 来 研究 相关 系数 的 性 质 ,通过 这 些 性 质 , 可 以 更 深刻 地 理解 相关 系数 
的 含义 ,以 下 研究 都 是 在 方差 ok M of 存在 且 都 不 为 零 的 假设 下 进行 , 即 相 关 
系数 存在 的 条 件 下 进行 ,以 后 不 再 重复 叙述 这 一 点 。 
定理 3.3.8: — 1 < Corr(X,Y) < 1 (3. 3.14) 
证 :这 可 从 协 方差 性 质 (3. 3.6) 式 看 出 。 
”定理 3.3.9 Corr(X,Y) == 土 1 的 充 要 条 件 是 在 义 与 Y 间 几乎 处 处 有 线 
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证 :充分 性 .和 匣 了 一 aXTB (X=cY Hd 也 一样 ) , 则 Corr( X,Y) = +£ 
IL HT E, 4 Y =aX + bhf, = a*d, Cov (X,Y) = Cov(X ,aA + b) = 
aCov(X, X) = ao ,代入 相关 系数 定义 ,可 得 


Corr(X,Y) = A 
ací ls 4 一 1 
Ey a 一 0 
这 就 证 明了 充分 性 。 


DERE E Corr(X, Y) = 土 1, 则 几乎 处 处 有 Y= 二 aX 十 5, 为 证 明 此 点 ,我 
们 来 考察 如 下 方差 


var| Ž + x| = 2[1 + Corr(X,Y)] 
当 Corr (X,Y) 一 1 时 ,Var| E 一 E] 一 0, 而 方差 为 零 的 变量 必 几 乎 处 处 为 党 
数 , 即 
X Y -1 或 ply- ax a) 


这 正 说 明 在 和 与 了 间 几 乎 处 处 有 线性 关系 , 且 斜 率 oy/ox HE. 类似 地 , 当 
Cor(X,Y) =— 1 时 ,有 


P 


A ,Ys __ Ë _ 
X t == 18 PY = A + cor = ] 


这 正 说 明 在 X 与 了 间 几 乎 处 处 有 线性 关系 , 且 斜 率 一 cr/ox 为 负 . 这 样 就 证 明 
了 必要 性 。 

定理 3.3.10 若 和 与 了 是 相互 独立 随机 变量 , 则 Corr(X,Y) = 0, 反 之 
不 然 。 

E: HF X5Y 443,328 51 Cov(X,Y) = 0, AMA Corr(X,Y) = 0,18 
从 Corr(X,Y) = 二 0 不 一 定 有 关 与 YY 独立 ,为 了 说 明 这 一 点 ,只 要 举 出 一 个 反例 
BA. EX ~ NC(0,1),Y = X?, 于 是 有 | 

E(X) = 0, E(Y) = E(X?) = 1 
E(XY) = E(X?) = 0 

可 见 Cov(X,Y) = E(XY) — E(X)E (Y) = 0, MM Corr(X,Y) = 0,18 
X 5Y HRA RAKK :Y 二 Xi, 不 能 说 XX 与 YY 独立 ,这 就 证 明了 “反之 不 然 ”。 

定理 3. 3. 10 说 明 :两 个 随机 变量 间 的 独立 与 不 相关 是 两 个 不 同 概念 .不 
相关 ”只 说 明 两 个 随机 变量 之 间 没 有 线性 关系 ,而 “独立 ”说 明 两 个 随机 变量 
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之 间 既 无 线性 关系 ,也 无 非 线 性 关系 ,所 以 “独立 ” 必 导 致 “不 相关 ”, 反 之 不 
然 。 这 两 个 概念 在 逻辑 上 的 关系 如 图 3. 3. 1 所 示 。 


3.3.1 独立 与 不 相关 的 逻辑 关系 


但 有 一 点 例外 ,在 二 维 正 态 分 布 场合 ,不 相关 与 独立 等 价 MERA X 与 
Y AX Cov (X,Y) = 0) 等 价 于 相关 系数 Corr(X 了) = 0. 当 (和 了) 为 二 维 
正 态 变量 时 ,Corr( 忆 ,7 了) = p( 见 例 3.3.8), LUX 与 了 不 相关 等 价 于 po = 0， 
而 2 一 0 是 和 与 了 独立 的 充 要 条 件 ( 见 例 3. 2. 2) .二 维 正 态 分 布 的 这 个 独特 性 
质 使 人 们 判断 二 维 正 态 变 量 的 独立 性 变 得 简单 得 多 , 只 要 验证 其 相关 系数 或 
协 方差 是 否 为 零 即 可 。 


ZAA 


(a) P=1 * (b) p>0.5 * 


dele, 


(c) P<0.5 (d) P=0 


3.3.2 ”相关 系数 大 小 示意 图 ,其 中 (了 ,7) 
ES 上 均匀 分 布 
二 维 正 态 分 布 的 这 个 例外 并 不 影响 定理 3. 3. 10 成 立 。 
上 述 定 理 3. 3.9 和 定理 3. 3. 10 说 明 相 关系 数 Corr(X,Y) 的 两 个 极端 。 当 
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Corr(X,Y) = 08,X 与 Y 间 无 线性 关系 ; 当 Corr(X,Y) = 土 1 时 ,X 与 Y 间 
有 线性 关系 ;而 当 0< |Corr( 久 ,7 了) | 二 1 时 , 则 认为 X 与 Y 间 有 “一 定 程度 ”的 
线性 关系 ,Corr(X,Y) 您 接近 t1, 其 线性 相关 的 程度 就 愈 高 ( 见 图 3. 3. 2(b)), 
当 Corr(X 了 了 ) 全 接近 0 时 , 其 线性 相关 的 程度 就 意 低 ( 见 图 3.3. 2(c0)); Y 
Corr(X Y) >0 时 ,了 将 随 着 和 增加 而 增 大 ; 当 Corr(X,Y) 二 0 时 ,Y KME X 
增加 而 减少 .所 以 相关 系数 是 衡量 六 5 Y 间 线 性 相关 程度 的 特征 量 。 


"$349 条 件 分 布 与 条 件 期 望 


3.4.1 条 件 分 布 的 概念 

多 维 随机 变量 的 各 个 分 量 之 间 关 系 主 要 表现 为 独立 与 相依 两 类 关系 , 独 
立 性 已 在 3.2 作 了 讨论 ,线性 相依 性 在 § 3. 3.4 中 也 作 了 一 些 讨 论 。 现 在 我 
们 者 手 讨论 一 般 的 相依 性 .假如 两 个 随机 变量 XX 与 Y 不 独立 , 则 革 与 Y 间 就 有 
一 定 的 相依 性 ,由 于 X 与 Y 取 值 的 随机 性 ,它们 之 间 一 般 不 会 呈现 出 一 种 确定 
性 函数 关系 ,但 对 随机 现象 的 大 量 观 察 就 会 发 现 它们 之 间 隐 售 着 某 种 趋势 ,为 
了 把 这 种 趋势 揭露 出 来 ,最 有 用 的 工具 是 条 件 分 布 与 条 件 期 望 ,下 面 例子 会 给 
我 们 一 些 启 发 。 

例 3.4.1 在 一 个 地 区 或 一 个 国家 中 父亲 的 身高 夭 和 儿子 (成 年 人 ) 的 身 
高 了 是 一 个 二 维 随机 变量 (X,Y), 从 遗传 学 上 看 ,或 人 人们 生活 经 历 上 看 ,这 
两 个 随机 变量 不 会 是 相互 独立 的 , 父 高 和 会 影响 儿子 的 身高 了 ,看 到 父亲 很 高 
就 会 想到 他 的 儿子 ( 符 有 的 话 ) 不 会 很 低 ; 看 到 小 个 子 的 男 青年 也 会 想到 他 父 
亲 亦 不 会 很 高 .但 也 不 是 绝对 的 ,可 能 有 例外 ,大 多 数 场合 下 ,上 述 的 经 验 事实 
是 经 营 出 现 的 ,所 以 父 高 了 与 儿 高 了 之 间 是 相依 的 两 个 随机 变量 。 

如 何 研 究 这 种 相依 性 呢 ? 首 先 把 父亲 的 身高 固定 在 一 个 水 平 上 ,譬如 固定 
在 zi =1.5000) 处 ,这 些 身高 为 1.5 米 的 父辈 们 的 儿子 身高 不 会 是 相同 的 ， 
有 高 有 低 , 在 有 些 高 度 上 人 多 一 些 ,在 另 一 些 高 度 上 人 少 一 些 ,呈现 出 一 定 的 
分 布 ,这 是 父 高 为 1.5 米 条 件 下 ,儿子 身高 Y 的 分 布 . 若 以 概率 密度 函数 表示 ， 
可 记 为 p(y|X = zx), 它 就 是 条 件 密度 函数 ( 见 图 3.4.1). 

当 条 件 改变 时 , 辟 如 父 高 固定 在 zs = 1. 6( 米 ) 处 ,其 子 身高 Y 也 有 一 个 条 
件 密度 函数 p(y|X = zx;) ,类 似 地 可 写 出 不 同 条 件 下 ( 父 高 固定 在 不 同 水 平 
LY 的 条 件 密度 函数 ( 见 图 3.4.1) 
p(y|X 一 11), py |X = Tz), p(y|X = Had, 。…， ply|X = Ln) 2 

152 


PUT) y ULA 


E(Y|X=x) =0:4Px 


x(S) 


3.4.1 条 件 分 布 与 条 件 期 望 示意 图 

从 这 些 条 件 密度 函数 的 位 置 看 ,其 位 置 随 着 X 的 取 值 增加 而 显示 增 大 的 趋 
$, 假如 用 条 件 密度 的 均值 (就 是 条 件 期 望 , 记 为 E(Y |X = zx)) 表示 分 布 位 
置 , 则 ECY|X = z) 将 随 着 工 增加 而 增加 。 在 这 个 例子 中 呈 线 性 增加 ,而 在 其 
它 场合 可 能 是 某 个 函数 f(zx) ,进一步 要 研究 的 是 :E(Y |X = z) 是 zx 的 函数 的 
具体 形式 是 什么 ?这 是 回归 分 析 要 研究 的 问题 ,这 里 就 不 再 深入 下 去 了 ,本 节 
以 后 篇 幅 将 把 研究 重点 放 在 条 件 分 布 及 其 条 件 期 望 上 , 致力 于 把 这 些 概念 和 
所 涉及 的 一 些 计算 弄 明白 。 


“3.4.2 ”离散 随机 变量 的 条 件 分 布 
对 于 任意 两 事件 A 和 B, 当 P(B) >> 0 时 ,在 互 已 发 生 条 件 下 ,事件 4 发 


生 的 条 件 概 率 定 义 为 


- P(AB) 
P(A|B) = PB) 
因此 ,如 果 (X,7) 是 二 维 离散 随机 变量 ,其 联合 分 布 为 
P(X =x¡ = y;) = Pijs ¿== 1,2)“, J3=1,2,"" 


那么 对 一 切 使 P(Y = y) > 08 y LEN BEY = y FX BRASI” H 
P(Y = y;) Pp 


P(X = xl Y = y) = ¿=1,2,+."" (3.4.1) 
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ER p., = P(Y = y;) = Pi。 在 这 个 条 件 分 布 中 ,Y [5d EXE y, Es MIE X EE 


机 取 值 .类似 可 定义 “给 定 下 三 天 下 7 了 的 条 件 分 布 ” 
P(X = ax, Y = y;) Pi 
P(X = T;) Pi- 7 


PO = y |X = x,) = 了 一 2， 
(3. 4. 2) 
其 中 pi. = P(X = x;) = 2ybijo 


例 3.4. 2 ” 设 二 维 离散 概率 分 布 如 下 表示 ， 


0.1 0. 3 0. 2 
0. 2 O. 05 0. 15 


H bi GI 5 p 01D) 已 求 得 ,也 列 在 上 表 中 ， 
RAAG. 4.1)， 给 定 和 一 1 下 ,7 的 条 件 分 布 ? 用 第 一 行 上 的 三 个 概率 
( 指 0.1,0. 3 和 0. 2) 分 别 除 以 第 一 行 的 行 和 pi = 0.6 就 可 得 到 ,具体 如 下 ， 
P(Y =1|X = 1) =0.1/0.6 = 1/6 
P(Y = 2|X = 1) =0. 3/0. 6 = 1/2 
P(Y = 3|X = 1) =0. 2/0. 6 = 1/3 
把 它们 合 在 一 起 写 ,可 记 为 


1/6, j=1 

eo ix pol j=2 

1/3, 7 一 3 

KMH, RE X = 1 下,Y 的 条 件 分 布 ” 亦 可 类 似 求 得 
1/2, 7 一 1 

ra- j=2 

3/8, j=3 


由 于 X 只 可 能 取 两 个 值 , 故 在 了 给 定 下 Y 的 条 件 分 布 只 有 这 两 个 ,而 给 
EY F.X MERMA PA EME 

aw as /1/3, i=l 

P(X =1|Y = 1) = a ¿9 

P(X =ilY = 2) = W S , 
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| 4/7, i=] 
P(X = i|Y = 3) = | 
3/7, 1=2 
在 这 个 例子 中 共有 五 个 不 同 的 条 件 分 布 , 在 实际 问题 中 可 能 遇 到 的 条 件 
分 布 会 更 多 ,但 其 计算 方法 都 按 (3. 4. 1) 和 (3. 4. 2) 两 个 公式 进行 。 
例 3.4.3 设 X 与 Y 是 两 个 相互 独立 的 泊 松 变量 , 且 X ~ P(N),Y ~ 
PAD .在 已 知 X HY = n 的 条 件 下 , 求 X 的 条 件 分 布 。 
解 : 由 习题 3. 2. 13 知 ,在 独立 场 台 和 X SY PA 十 j)。 在 这 个 问题 中 虽 
然 筷 与 了 相互 独立 ,可 和 与 X 十 YY 是 相依 的 。 这 里 要 求 条 件 分 布 
P(X =k|[X+Y=nm), k=05,1,2,*""»m 
HEP n EREN, HFRIX + Y =n, i X HUB ABBR n. A FRIAR 
率 . 


P(X =k|X +Y =n) = 5R X tY =n) 


P(X Y =n) 


_PQA=RPQY=n—k) 
P(X + Y =n) 


a A 
a pÀ ‘a A, 
Ok Gak 


AA a 


o n] Ài Az 

kin 一 k)! CA + À)’ 

_ [nr Z] | Àz E _ 

y HET utal ? “= O01, 
这 表明 ,在 已 知 卫 十 了 = 二 mn 下 XX 的 条 件 分 布 是 以 及 久 /G +4) 为 参数 的 
二 项 分 布 py (A 十 如))。 


3.43 ”连续 随机 变量 的 条 件 分 布 

RAY) 是 二 维 连续 随机 变量 ,pl(z,y) 是 其 联合 密度 函数 ,p,(z) 和 
yO) 是 其 边缘 密度 函数 。 由 于 在 连续 场合 ,P(X =x) = 0,P(Y = y) = 0, 故 
在 PC 和 了 上 委 y 十 4Ay) > 0 时 , 改 为 考虑 如 下 条 件 概率 


PALAIS ZA 
Ti > 


y+ Ay 
ptx,vidydx 


Ñ y+ åy 
上 Py dy 
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: A | 


Af reviha 
a py ydy 

当 Ay > 0 时 ,上 式 左 端 为 P(X xilY =y) CAME Y =y F XSH 
EA) ADEN ERA Y = y 下 ,XX 的 条 件 分 布 函数 (x|y), 而 
在 上 式 右 端的 分 母 与 分 子 中 ,只 要 py(y) 和 p(x,y) 在 > 处 连续 , 则 由 积分 中 


值 定理 可 得 


lim — Pola, y dy = = plx,y) 


于 是 当 py) >0 时 在 给 定 y = =y PX 的 条 件 分 布 图 数 可 表示 为 


这 表明 p(x,y)/py(y) 是 在 给 定 了 一 ?下 三 的 条 件 密 度 函 数 , 记 它 为 p(x1y)， 
Bp 


p(xly)= OA (3. 4. 3) 


类 似 地 , 当 Pax) 0 时 ,可 得 在 给 定 = x PY 的 条 件 密度 函数 为 


piz) 一 PO) (3.4.4) 


TESSA) RELATA ATAR. 
例 3. 4. 4 RX, Y) ~ 一 入 (pa ,p201,02，P), 试 求 其 两 个 条 件 密度 函数 。 
解 :在 例 3.1.7 中 已 算出 互 与 了 的 边缘 分 布 分 别 为 N (pn,o?) 与 N(, 
0) ,于 是 有 


pal) = 22 


byo) 
= 一 一 jexp| 一 1 | (Z 一 Am) 
270,0, Y 1— p? 2(1— ø) g? 
op ED (19) Oo 1 [2 
cp 0,0, + o$ | | ~/ ano, | 20? 
_ l | | 1 | Ca— m)’ 
= -exp| Al 
Y 2x0, NV 1—p' 2(1—p%) o? 
— 20 (=y) Ha) o yp) | | 


010 0% 
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1 1 f Ao | 


这 正好 是 正 态 分 布 N| m +0 PO 一 10,00 P) ) .类 似 地 可 求 得 在 
给 定 X 一 下 Y 的 条 件 分 布 为 
N| pz 十 pa 一 pA),02(1 一 3) 
因此 ,二 维 正 态 变量 的 条 件 分 布 仍 为 正 态 ,这 正 是 正 态 分 布 的 又 一 个 重要 性 


质 。 
143.45 设 二 维 连续 随机 变量 (X,Y) 的 联合 密度 函数 为 


e T eT? 


p, y) = y | = 0< my E oo 
0, 其 它 场合 


要 求 P(X >1|Y = y), 
解 : 先 在 给 定 了 一 y 这 > 0 下 求 得 XX 的 条 件 密度 。 


plrly) = play) __e Pe ly _ on r>0 
Py y) | eda y 


Y Jo 


因此 在 y >0 时 ,有 
P(X > 1|Y = y) = [pte lnaz 


oo I/y 
e * 


1 J 
在 条 件 “Y = y” 没有 具体 给 定时 ,上 述 条 件 概率 也 不 能 完全 确定 ,只 能 用 y 的 
区 数 表示 出 来 ,一 旦 给 定 “Y = 1”, 则 有 
P(X>1lY=1)=e = 0. 3679 
上 述 条 件 概 率 也 就 随 之 确定 。 


—1/y 


3.44 ”构造 联合 分 布 | 
构造 联合 分 布 有 多 种 途径 .以 二 维 联合 密度 函数 为 例 , 至 今 已 涉及 三 种 途 
2 HERA F: 
DO 由 实际 背景 和 实际 数据 归纳 而 得 p(x,y), 如 二 维 均匀 分 布 .二 维 正 
D 分 布 等 .在 瞄准 目标 射击 中 弹 着 点 的 坐标 (X,Y) 是 二 维 随机 变量 ,其 联合 
密度 函数 可 用 二 维 正 态 分布 。 又 如 , 当 (X,Y) 只 能 在 平面 十 某 个 有 限 区 域 $ 上 
取 值 ,但 又 说 不 出 在 哪 一 个 部 分 上 取 值 的 可 能 性 更 大 一 些 时 ,就 可 用 区 域 S 上 
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的 均匀 分 布 来 表示 其 联合 分 布 。 
(2) 由 独立 性 而 得 如 (z,y) = px(7)py Cy)。3§ 3.2 中 的 例子 都 由 独立 性 导 
出 。 其 中 px(x) 各 py(y) 可 由 一 维 分 布 获得 。 
(3) 把 (3. 4. 3) 与 (3. 4. 4) 改写 为 
px) = pr lr) ply|z) (3. 4. 6) 
py) = pr|y) pr (y) (3. 4.7) 
即 用 一 个 变量 的 分 布 与 这 个 变量 给 定 下 另 一 个 变量 的 条 件 分 布 可 给 出 联合 分 布 。 
顺便 指出 ,假如 能 获得 的 密度 函数 pyx(z) 及 在 XX 给 定 下 Y 的 条 件 密度 
函数 冯 (y|z), 则 由 其 乘积 的 积分 可 得 Y 的 边缘 分 布 


0 一 | plz)px(z)dz (3. 4. 8) 


这 就 是 全 概率 公式 的 密度 函数 形式 ,在 离散 场合 下 的 全 概率 公式 已 在 
$ 1.5.3 中 讨论 过 , (3. 4. 8) 式 常 会 在 实际 中 使 用 。 
比较 (3. 4. 5) 和 (3. 4. 6) 可 得 
py |z)py (7) 
Pyy?) 
o bold», x) 
| rGIDA ddr 
XAMAE DEA ADE ERROR, I HRABE $1.5.4 4H 
讨论 过 。(3. 4. 9) 式 将 在 寻求 未 知 参 数 的 估计 中 要 用 到 。 | 
813.46 REX-U(0,D,r 是 其 一 个 观察 值 ,又 设 在 X= 二 x 下 Y 的 条 
件 分 布 是 U(z,1) .这 两 个 均匀 分 布 的 密度 函数 分 别 为 
l, O< ral 


z 思 (zly) = 


(3. 4. 9) 


prix) = | 


O, 其 它 场 合 
] 
一 一 一 ， 0 
soto = {i= li<Xy<l 

0, 其 它 场合 
由 此 可 得 (X,7Y) 的 联合 密度 函数 

] 

pæn = E O<xri<y<l 
O, 其 它 场 合 


其 不 为 零 的 区 域 如 图 3. 4. 2 的 斜 线 部 分 .而 Y 的 边缘 密度 pO) 在 区 间 (0,1) 
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Lr Tp bd rip rri y PP ep A = 


co Py ] | 
py(y) = [paz = | T Az 


== ha- y =In 77 


它 的 图 形 如 图 3. 4. 3 所 示 ,可 见 p(y) 是 一 个 无 界 函数 。 


1 


3.4.2. p(x, y £ 0 的 区 域 图 3.4.3 p,(y) 的 图 形 
( 例 3. 4. 6) (A 3. 4.6) 


MERRY > 0.5 的 概率 ,这 可 利用 上 述 p,(y) 
P(Y > 0.5) =— | In(1 一 yy 一 一 [nude 


最 后 一 个 等 式 是 利用 变换 xz = 一 1 y 得 到 的 ,lnw 的 原 函 数 为 zinzx — u, 
AN 
P(Y > 0.5) =— [ulnu — u]$* = 0. 5ln2 + 0.5 = 0. 8466 


3.45 条件 期 户 
定义 3.4.1 条 件 分 布 的 数学 期 望 称 为 条 件 期 望 , 它 可 用 条 件 分 布 算得 


DP X= Y=), 当 (X,Y) 为 二 维 离散 随机 变量 
E(Xly= 


["_zp(elydz, 当 (X,Y) 为 二 维 连续 随机 变量 


(3. 4. 10) 

其 中 P(X=zi]Y 二 y) 为 在 给 定 Y=y 下 X 的 条 件 分 布 ,pC(z1y) 为 在 Y= 二 y 下 
X 的 条 件 密度 函数 。 上 述 数 学 期 望都 假设 存在 。 
注意 条 件 期 望 匹 (Xily) 与 (无 条 件 ) 期 望 天 (X) 的 区 别 。 它 们 不 仅 在 计算 公 

式 上 有 和 章 要 差别 ,含义 也 绝 然 不 同 。 辟 如 XX 表示 中 国人 的 年 收入 , 则 E COR 
示 中 国人 的 平均 年 收入 。 若 用 Y 表示 中 国人 受 教 育 的 年 限 , 则 EC(X1y) 表 示 受 
过 y 年 教育 的 中 国人 群 中 的 平均 年 收入 。E(X) 只 有 一 个 ,可 EC(X|y) 有 很 多 
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T4 Y 取 不 同 值 时 ,如 Y=0,1,2,… 等 ,ECX|y) 值 是 不 同 的 。 一 般 来 说 EC(X 
INE y 的 某 个 函数 ,这 个 函数 刻 划 了 X 的 条 件 期 望 如 何 随 Y 的 取 值 y 变化 
MAMA XA 表示 中 国 成 年 人 的 身高 , 则 EC(X) 表 示 中 国 成 年 人 的 平 
HA. AAY 表示 中 国 成 年 人 的 足 长 (脚趾 到 脚跟 的 长 度 ), 则 ECX|y) 表 示 
是 足 长 为 y 的 中 国 成 年 人 的 平均 身高 ,我 国 公 安 部 门 研究 获得 
E(Xl|y)=6. 876 y 
一 案犯 在 保险 柜 前 面 留 下 足 印 , 测 得 25. 3 厘米 ,代入 上 式 算得 ,此 案犯 身高 大 
约 在 174 厘米 左右 。 这 一 信息 对 刻 划 案犯 外 形 有 重要 作用 。 
例 3.4.7 (X,Y) 的 联合 密度 函数 为 
pry) = I "Toy 
O, 其 它 场 合 
KEXI y 和 EC(Y|z). 
解 : 先 求 忒 与 了 的 边缘 密度 函数 ， 


px (Xx) = | plz, y)dy = f e dy=e", >o0 


O= | parda = [edr = ye", y>0 


m4 rs 0 时 ,有 Py) 一 0; 当 >y 委 0 时 , 亦 有 Pro) 一 0。 
ERRI. E y> oit, po) > 0, 故 有 

p > OKEY 

Py) 0 ， 其 它 场 合 

Æ x > 0 Hf per) > 0, 故 有 


(2, y) ce ”, QLIEL yoo 
7 ) AED 一 
ply|z pr C2) 0 ， 其 它 场合 


plaly) = 


最 后 求 条 件 期 望 


1 


? y 
E(X |y) = [z «dr = ， y>0 
0 y 2 


ERY = y” 尚 未 具体 给 定时 ,上 述 条 件 期 望 也 不 能 定 下 ,只 能 表示 为 y 的 
KA. BMR EY = 4”, 立 即 可 得 EC(X|y) = 2。 类 似 地 ， 
E(Y |x) 一 E ‘Ee dy 一 eye 
=e 了 [一 e (1 十 y) 近 一 (十 ze-z x>0 
一 般 场合 下 ， gema EY |x) 总 是 条 件 ORAR, RERA Ent, X 
= 1 W, EY |X = 1) = 2e ? = Q. 2707, 
160 


例 3.4.8 1E5(X, Y) — NC, 2,107,070), EW] 3.4.4 中 已 求 得 在 给 定 了 
一 yy 二 七 的 条 件 分 布 为 一 维 正 态 分 布 , 即 


X IY = y~ N(u + PO — m), (1 — o )) 
由 正 态 分 布 性 质 可 知 , 其 条 件 期 望 
E(X|y) = m Ho O p) (3.4.11) 


Ci y IRREAL o> 0, EX 19) HE 
y A AREA AMARE RE AA e < 0 HS EX y) Hi y 
增加 而 按 线 性 减少 ,这 就 是 “ 负 相 关 ”; 当 2 一 0 时 ,X E Y 独立,E(X|y) 当然 


与 》 无 关 。 
条件 期 望 是 条 件 分 布 的 数学 期 望 , 故 它 具 有 数学 期 望 的 一 切 性 质 ,譬如 : 
(DE(a,X, 十 a¿X¿ly) = a E(X¡ly) 十 a¿E(X¿|y (3. 4.12) 
(2) 对 任 一 函数 gC(X), 有 
2,2G)P(X=x,|Y=y), 在 离散 场合 
saco a | (3. 4.13) 
| g(r)plrly)dz, 在 连续 场合 


此 外 ,条 件 期 望 还 有 一 个 重要 性 质 。 
定理 3.4.1 条 件 期 望 的 期 望 就 是 (无 条 件 ) 期 望 , 即 
E| E(X|Y)] = E(X) (3.4.14) 
证 : 先 在 连续 场合 证 明 。 由 (3. 4. 7) 可 得 
ECX) = | S | “ap(a, ydrdy 


— 0 — OG 


一 | | zzcelyarC)dzdy 


—0  —00 


一 [ò [relazi ody 


= i EX |y b y)dy 


由 于 条 件 期 望 E(X|y) 是 y 的 函数 , 记 为 g(y)。 则 上 式 就 是 随机 变量 函数 
gY) 的 期 望 值 , 即 
E(X) = Elg(Y)] = E[E(X|YP)] 
类 似 地 , 亦 可 在 离散 场合 证 明 上 式 成 立 。 
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这 个 命题 不 仅 在 概率 论 中 是 一 个 较 深 刻 的 命题 ,而 且 在 实际 中 很 有 用 ,在 
不 少 场 合 ,直接 计算 EC(X) 是 困难 的 ,而 在 限定 变量 Y( 与 有 关系 的 量 ) MÍ 
y 之 后 ,计算 条 件 期 望 严 (X|y) 则 较为 容易 .因此 可 分 二 步 走 :第 一 步 借 助 条 件 
分 布 p(x1y) 和 固定 的 y BRERA EX y) SPARE y AE Y 的 取 
值 ,EC(X|y) 看 作 Y = y 时 X 取 值 的 平均 ,借助 了 的 分 布 py(y) 再 求 一 次 期 望 ， 
先 后 两 次 期 望 即 得 A(X) ,更 直观 一 些 说 ,你 可 以 把 E(X) 看 作 在 一 个 很 大 范 
围 上 求 平均 ,然后 找 一 个 与 XX 有 关 的 量 Y, 用 Y 的 不 同 值 把 上 述 大 范围 划分 为 
否 干 个 小 区 域 , 先 在 每 个 小 区 域 上 求 平均 ,再 对 此 类 平均 求 加 权 平 均 , 即 可 获 
”得 大 范围 上 的 平均 EC(X)。 壁 如 要 求全 校 学 生 的 平均 年 龄 ,可 先 求 出 每 个 班级 
学 生 的 平均 年 龄 ,然后 再 对 各 班 平均 年 龄 求 加 权 平 均 ,其 中 权 就 是 班级 人 数 在 
全 校 学 生 中 所 占 的 比例 。 

例 3. 4.9 ”一 矿工 被 困 在 有 三 个 门 的 矿井 里 。 第 一 个 门 通 一 坑道 , 沿 此 坑 
道 走 3 小 时 可 使 他 到 达 安 全 地 点 ;第 二 个 门 可 使 他 走 5 小 时 后 又 回 到 原 处 ;第 
三 个 门 可 使 他 走 7 小 时 后 也 回 到 原 地 .如 设 此 矿工 在 任何 时 刻 都 等 可 能 地 选 
定 其 中 一 个 门 ,试问 他 到 达 安 全 地 点 平均 要 用 多 长 时 间 ? 

解 : 设 XX 为 该 矿工 到 达 安 全 地 点 所 需 时 间 (单位: 小时) ,Y 为 他 所 选 的 门 ， 
则 由 (3. 4.14) 可 得 

EX) =EX|Y=DPY=1)+E(X|Y=2) x 
PY = 2) + E(XIY = 3) P(Y = 3) 
AP PO =1) = P = 2) = PY = 3) =1/3,E(X |Y =1)=3.m E(X |Y 
= 2) 为 矿工 从 第 二 个 门 出 去 要 到 达 安 全 地 点 所 需 平 均 时 间 , 而 他 沿 此 坑道 走 
5 小 时 又 转 回 原 地 ,而 一 旦 返回 原 地 ,问题 就 与 当初 他 还 没有 进 第 二 个 门 之 前 
一 样 , 因 此 他 要 到 达 安 全 地 点 平均 还 需 再 用 E OO 小 时 , 故 
E(X|Y = 2) = 5 + E(X) 
类 似 地 有 
E(X|Y = 3) =7 + E(X) 
代 回 原 式 ,可 得 
E(X) = (3 +5 + E(X) +7 + E(X)) 
E(X) 一 15( 小 时 ) 
该 人 矿工 到 达 安 全 地 点 平均 需要 15 小 时 。 
例 3.4.10 设 走 进 某 百货 商店 的 顾客 数 是 均值 为 35000 的 随机 变量 .又 


设 这 些 顾客 所 花 的 钱 数 是 相互 独立 ,均值 为 52 元 的 随机 变量 。 再 设 任 一 顾客 
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所 花 的 钱 数 和 进入 该 商店 的 总 人 数 相 互 独立 .试问 该 商店 一 天 的 平均 营业 额 
是 多 少 ? 
解 : 令 N 表示 走 进 该 商店 的 顾客 数 ,X; 表示 第 i 位 顾客 所 花 的 钱 数 , 则 入 


位 顾客 所 花 的 总 钱 数 > 和， 就 是 该 商店 一 天 的 营业 额 . 由 于 


ELS X] = ELE( >X: N) |] 

其 中 

E(D X:N = n) = EOIXO =nE(X,) 
上 式 最 后 第 二 个 等 式 成 立 是 由 于 诸 X; 与 入 独立 ,从 而 条 件 期 望 就 是 无 条 件 期 
望 

ECOWIN) = NE(X,) 

从 而 

E[ >,X:] = ELNE(X1)] = E(N) +» E(X,) 
在 我 们 问题 中 ,ECN) = 35000A) ECX) = 52 元 , 故 该 商店 一 天 的 平均 营 
业 额 为 35000 X 52 = 1.82 HAT. 

这 是 一 个 寻求 个 数 为 随机 的 独立 随机 变量 和 的 数学 期 望 问 题 ,这 类 问题 

很 多 , 壁 如 ,一 只 昆虫 一 次 产 卵 数 N 为 随机 的 ,每 只 卵 成 活 的 概率 为 ,假如 入 
服从 参数 为 的 泊 松 分 布 , 则 一 只 昆虫 一 次 产 卵 能 成 活 的 平均 数 为 Ap。 又 如 ， 


一 疾 类 的 个 数 入 为 随机 的 ,如 果 每 只 野兽 掉 入 人 们 设置 陷 井 的 概率 为 p, 则 被 
撒 获 的 野兽 的 平均 数 为 ECN)ECX1), 其 中 X ~ 5(1,p)。 


$3.5 中心 极限 定理 


中 心 极限 定理 是 概率 论 中 最 重要 和 最 常用 的 一 类 极限 定理 ,我 们 从 一 个 
重要 现象 谈 起 。 


3.51 一 个 重要 现象 


n 修 相互 独立 、 同 分 布 的 随机 变量 之 和 的 分 布 近 似 于 正 态 分 布 , 并 且 nA 
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大 ,此 种 近似 程度 愈 好 ,这 一 重要 现象 可 从 下 面 两 个 例子 看 出 。 
例 3.5.1 EHRT ER 次 ,其 点 数 之 和 YY, 是 个 相互 独立 同 
分 布 的 随机 变量 之 和 , 即 
Y, = X FX tee +A, 
其 中 诸 X; 的 共同 的 概率 分 布 为 


1/6 1/6 1/6 1/6 1/6 1/6 
这 也 是 Y, 的 概率 分 布 , 其 概率 直方 图 (图 3. 5.1(a)) 是 平 顶 的 。 

当 n 二 2 时 ,了 , 二 XX 十 X; 的 概率 分 布 可 用 离散 形式 的 着 积 公 式 (3. 2. 9) 
求 得 。 


P 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 


它 的 概率 直方 图 (图 3. 5. 1(b)) 至 单 峰 对 称 的 阶梯 形 , 且 阶梯 的 每 阶 高 度 相 
Fo 

当 n = 3 和 4 时 ,7s: = X, + (X: +X 的 概率 分 布 和 Y4 二 (Xi 十 X 2) 十 
(As + XD 的 概率 分 布 都 可 用 卷 积 公式 求 得 ,它们 的 概率 直方 图 (图 3.5.10 
与 (d)) 仍 呈 单 峰 对 称 的 阶梯 形 , 但 台阶 增多 ,每 个 台阶 高 度 不 等 ,中 间 台 阶 高 度 
要 比 两 侧 台 阶 高 度 略 高 一 点 ,从 图 (c) 和 (d) 上 已 显现 出 正 态 分 布 的 轮廓 。 

当 n 骨 增 大 时 ,可 以 想象 Y = Xy + X2 +e HX, RIRE E N ARE 
线 与 正 态 密度 曲线 更 为 接近 ,只 是 分 布 中 心 EY.) 将 随 着 的 增加 不 断 地 向 
AB) 而 标准 差 v(Y,) 不 断 增 大 .假如 对 Y, 施行 标准 化 变换 后 ,所 得 
CL ER) XA AX E +e +X) 


Ya = o(Y.) / 
Var(X + e + X,,) 

= Xit ee + X, — nE(X:) 

o Jn o (Y) 
的 分 布 有 望 接 近 标 准 正 态 分 布 (0,1) ,这 种 期 望 已 被 证 明 是 正确 的 ,在 标准 正 
ST NO, D 的 帮助 下 近似 计算 概率 PY, <a) 已 不 是 很 困难 的 事 了 。 

BE U , 4 n= 100 时 ,E(Yiw) = 100 X 3.5 = 350,6(Y 100) = 4100 X 1.71 

一 17.1, 于 是 利用 标准 正 态 分 布 可 得 ， 


Y 100 — 350 -一 400 一 350 
17.1 > 17.1 


= P(Y ho < 2. 9240) == DC2. 9240) = 0. 9982 


P CY ioo S 400) = P 
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1/6 


E(Y)=3.5 
Var (1) =2.9167 

c(%)=1.71 
2 4 6 


(adY, =X, 的 概率 分 布 


> 6 
Ll ii 


E(x)=7.0 
Var (¥,) =5.8334 
o (Y,) =2.42 


y 
2 4 6 8 10 12 


(b)Y, = X, + X: 的 概率 分 布 (矩形 顶端 数字 = € 一 矩形 面积 ) 


E(x)=10.5 | 
Var(%)=8.7501 
o{(%) =2.96 


6 


27x6" a: E 
15 
10 


3.1 


E (x)=14 
EUS d:u TT 1297 D Var( 了 ) =59.3056 
C(Z) =7.70 


(DY), = X, + X: 的 概率 分 布 (矩形 顶端 数字 : € = 矩形 面积 ) 
3.51 SARET ,点 数 之 和 的 概率 分 布 


假如 不 利用 正 态 近似 ,完成 此 种 计算 是 很 困难 的 ,最 后 结果 表明 :连续 100 次 
RRT, HAZ AMARAL 400 几乎 是 必然 发 生 的 事件 。 
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例 3.5.2 讽 并 ,和 ,有 ,是 二 个 独立 同 分 布 的 随机 变量 ,其 共同 分 布 为 
区 间 (0,1) 上 的 均匀 分 布 , 即 诸 X; ~U 0,1). Amn = 100, 要 求 概率 P(X 十 
X2 + +X,< 60) =? 

要 精确 地 求 出 上 述 概 率 ,就 要 寻求 x 个 独立 同 分 布 随机 变量 和 Y, = Xi + 
X: 十 … +X, DIA EW pO 为 了 ,的 密度 函数 , 则 在 较 小 的 场合 尚 能 用 
卷 积 公式 (3. 2. 13) EN py), E 

l, 0Xy<l 
Pity) = | 


O, 其 它 场 合 
y s 0X<y<l 
nn 1<y<2 
0 ， 其 它 场合 
对 pa《y) 和 pi《y) 使 用 卷 积 公式 (3. 2. 13) 又 可 得 ys: 一 Xi 十 X2 十 Xi 的 密度 函数 
y/2, 0<y<1 | 
— (y — 3/2 + 3/4, 1<y<2 
p3(y) = 
(3 一 y*/2, 2 y< 3 
0, 其 它 场合 


这 是 一 个 连续 函数 , 它 的 非 零 部 分 是 由 三 段 二 次 曲线 相连 ( 见 图 3. 5. 2) ,类 似 
地 可 求 出 Y, 一 Xı 十 X, + X3 + 从 4 的 密度 函数 


y /6, 0<y<1 
Ly — (y 一 1)3]/6,) 1 y<2 
Py) = SL — y)? — 4(3— y)?]/6, 2<y<3 
(4 一 y)?/6, = 3<y<A4 
0, 其 它 场 合 
这 也 是 一 个 连续 的 函数 ( 见 图 3. 5. 2) , 它 的 非 零 部 分 是 由 四 段 三 次 曲线 相连 ， 
pO) pO) 


Æ 3.5.2 均匀 分 布 的 卷 积 


并 且 连 接 处 较为 光滑 。 照 此 下 去 ,可 以 看 出 ,7, 的 密度 函数 p,(y) 是 一 个 连续 
166 


陋 数 , 它 的 非 零 部 分 是 由 nn 段 n 一 1 次 曲线 相连 ,但 是 要 具体 写 出 p,(y) 的 表 
达 式 绝 非 易 事 。 即 使 写 出 表达 式 , 使 用 起 来 也 很 不 方便 。 这 样 一 来 ,要 精确 计算 
概率 p(X, 十 … +X, <60) 就 发 生 困 难 。 图 3.5.2 给 人 们 提供 了 一 条 解决 这 
个 问题 的 思路 , 随 着 nn 增加 ,p(y) 的 图 形 愈 来 愈 接近 正 态 曲线 .并 且 光 滑 程度 
也 愈 来 愈 接 近 正 态 密度 曲线 的 光滑 程度 。 

如 例 3. 5. 1 一 样 , 当 增 大 时 Y, 的 密度 函数 p,(y) PH EY.) AE, PRAE 
差 ol(Y,) 增 大 ,为 了 克服 这 些 障 碍 ,使 用 标准 化 技术 就 可 使 极限 分 布 稳 定 于 标 
准 正 态 分 布 N(0,1), 用 此 极限 分 布 计算 上 述 概率 已 不 是 很 难 的 事 了 。 

由 于 均匀 分 布 U(0,1) 的 期 望 与 标准 分 别 为 

E(X)=0.5, —«(X) = V1/12 = 0. 2887 


当 n=100 EF, ECY 10) =100X0. 5=50,0 (Y „) = Y 100 X0. 2887 = 2. 887. 于 是 
PA, + “+ Xw < 60) 


p| Xi + Xw — 50 _ 60 — 50 
=P | 2. 887 S “2887 


= D(3. 464) = 0. 9997 
这 个 概率 很 接近 于 1, HAREA 十 ++ + X 100 < 60” 几 乎 是 必然 要 发 生 的 。 


3.5.2 ”独立 同 分 布下 的 中 心 极限 定理 

定理 3. 5. 1( 林 德 贝 格 一 列 维 中 心 极限 定理 ) X.) 是 独立 同 分 布 随机 
变量 序列 ,其 E(X)) = py,Var(X1) = o?, 假 如 方差 ot 有 限 , 且 不 为 零 (0 二 0 一 
co), 则 前 = 个 变量 之 和 的 标准 化 变量 


Y, = (3.5.1) 
H PORFA 1 — oo 而 收 仿 于 标准 化 正 态 分 布 函数 更 (y) , 即 对 任意 实数 y 
limP (Y; < y) = (y) (3.5.2) 


这 个 定理 的 证 明 需 要 更 多 的 数学 工具 ,这 里 就 省 略 了 ,这 个 中 心 极限 定理 
是 由 林 德 贝 格 和 列 维 分 别 独 立地 在 1920 年 获得 的 ,这 个 定理 告诉 我 们 ,对 独 
江 同 分 布 随 机 变量 序列 ,只 要 其 共同 分 布 的 方差 存在 , 且 不 为 零 , 就 可 使 用 该 
定理 的 结论 (3. 5. 2)。 由 于 掷 一 颗 仍 子 出 现 点 数 的 方差 为 2. 9167, 均 名 分 布 
[7 (0,1) 的 方差 为 1/12 ,它们 都 有 限 , 且 不 为 零 , 所 以 例 3. 5.1 和 例 3. 5.2 的 计 
算 全 部 有 效 。 

定理 3. 5.1 的 结论 告诉 我 们 ,只 有 当 充分 大 时 ,Y;* 才 近 似 服 从 标准 正 态 
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分 布 NC(0,1) ,而 当 n 较 小 时 ,此 种 近似 不 能 用 .在 概率 论 中 ,和 常 把 只 在 x 充分 
大 时 才 具 有 的 近似 性 质 称 为 浙 近 性 质 ,而 在 统计 中 称 为 大 样本 性 质 。 这 样 一 
来 ,定理 3. 5. 1 HARAN Y 源 近 服从 标准 正 态 分 布 NC(0,1), 或 者 说 ， 
Y; 的 渐 近 分 布 是 标准 正 态 分 布 N(0,1), 记 为 

Y: =N(0,1) (3. 5. 3) 
这 种 符号 表明 ,Y; 的 真实 分 布 不 是 和 (0,1) ,只 是 在 z 充分 大 时 ,7Y: 的 真实 分 
布 与 NOD 近似 ,并 且 n 愈 大 ,此 种 近似 程度 愈 好 ,所 以 只 有 在 较 大 时 ,可 
用 和 (0,1) 近似 计算 与 Y* 有 关 事 件 的 概率 ,而 4 较 小 时 ,此 种 计算 的 近似 程度 
是 得 不 到 保障 的 。 

当 (3. 5. 3) 式 成 立时 ,由 (3. 5. 1) 表达 式 不 难 获 得 


> Xi; ~ Ní(npusyno”) 
:二 1 
o. N| pa 
RAN 


这 表明 : 当 较 大 时 ,可 用 正 态 分 布 N| u, Z ASS n ALM A 


布 随机 变量 的 算术 平均 值 中 有 关 事 件 的 概率 和 各 阶 矩 ,这 在 应 用 中 是 有 重要 


3.53 ”二 项 分 布 的 正 态 近 似 

现在 让 我 们 来 研究 一 个 特殊 场合 一 一 相互 独立 的 贝 努 里 试验 序列 .大 家 
知道 ,一 次 贝 努 里 试验 仅 可 能 有 两 个 结果 :成功 ( 记 为 1) 和 失败 ( 记 为 0)。 若 设 
成 功 概 率 为 户 二 0, 则 一 次 贝 努 里 试验 结果 可 用 一 个 服从 二 点 分 布 5(1,p) 的 
随机 变量 X 表示 ; 

p(X = 1)=þ, (X: =0)=1-—p 
ENMBSIZLAIAMA E(X) = p,Var(X,) = pA 一 加 )。 这 样 一 来 ,独立 的 
贝 努 里 试验 序列 对 应 一 个 相互 独立 . 同 分 布 ( 皆 为 &1,z)) 的 随机 变量 序列 
{Xarlo 

该 序列 (Xi) 前 4 项 之 和 Y, = X +X: 十 … tX 是 服从 二 项 分 布 bln, 记 ) 
的 随机 变量 ,其 中 YY, 为 上 重 贝 努 里 试验 中 成 功 出 现 的 次 数 ,由 于 该 序列 中 的 共 
同 分 布 的 方差 有 限 , 且 不 为 零 , 故 满足 定理 3. 5. 1 的 条 件 。 从 而 可 得 如 下 定理 ; 
定理 3. 5. 2( 德 莫 弗 一 拉 普 拉 斯 定理 )” 设 随机 变量 Y, bp). WEE 
准 化 随机 变量 Y* = (Y, 一 np)/ npa — p) 的 分 布 函 数 的 极限 
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mP) a p) 

其 中 PO) 为 标准 正 态 分 布 N (0,1) 的 分 布 函数 。 

这 个 定理 是 最 早 的 中 心 极限 定理 .大约 在 1733 年 德 莫 弗 对 p = 二 1/2 证 明 
了 上 述 定 理 , 后 来 拉 普 拉 斯 把 它 推广 到 p 是 任 一 个 小 于 1 的 正 数 上 去 。 

这 个 定理 的 实质 是 用 正 态 分 布 对 二 项 分 布 作 近似 计算 , 常 称 为 “二 项 分 布 
的 正 态 近似 ”, 它 与 “二 项 分 布 的 泊 松 近似 ( 见 定理 2. 2. 0" HER n 很 大 ,但 
在 实际 使 用 中 为 获得 更 好 的 近似 ,对 p 还 是 各 有 一 个 最 佳 适用 范围 。 

当 p 很 小 , 辟 如 p 世 0.1, 而 np 不 太 大 时 用 泊 松 近似 ; 

当 np 之 5 和 nn(1 一 p) 之 5 都 成 立时 用 正 态 近似 。 

210,4 n= 25,p 二 0.4 时 ,np = 二 10 和 (1 一 pp) = 15 都 大 于 5, 这 时 用 
正 态 近似 为 好 ( 见 图 3.5. 3a); 当 n= 25,p 二 0.1 时 ,np = 2.5 过 5, 这 时 用 正 
仿 近 似 误 差 会 大 一 些 ( 见 图 3. 5. 3b), 而 用 泊 松 近似 为 好 。 


y 
< y = (y) (3. 5. 2) 


n=25, P=0.1 


图 3.5.3 二 项 分 布 的 正太 近似 
使 用 “二 项 分 布 的 正 态 近似 ”( 即 定理 3.5.2) 时 还 有 一 项 修正 ,在 图 
3. 5. 3(a) 上 男 出 了 二 项 耸 布 6(25,0. 4) 的 概率 直方 图 ,图 上 长 条 矩形 ( 底 长 为 


D 面积 表示 二 项 概率 PCY, = 4) = (3) PA 一 :其 中 4 位 于 矩形 底部 的 
PR ARMA Y, 在 [5,15] 的 概率 , 使 用 正 态 近似 应 把 区 间 修 改 为 
[5 41s 十 十], 这 种 合理 的 修正 可 提高 近似 程度 , 葡 如 ,二 项 分 布 (25， 


0. 4) 与 正 态 分 布 N(10,6) 很 接近 ,是 数学 期 望 np = 10 相 同 ,方差 np(1 一 p) 
= 6 也 相同 ,这 时 要 计算 Y, 在 [5,15] 内 的 概率 ,车 使 用 正 态 近似 最 好 把 区 浊 


修改 为 [5 一 工 ,15 十 Ll ,这 样 可 以 提高 精度 。 
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P6<Y,<15 =P15-L<Y,<15+ 4) 


B ES 
Y 6 


- ? <y; < LS 


VAJ 
= P(— 2.245 < Y, < 2.245) 
= P(2. 245) — Pl— 2.245) 
一 29(2. 245) — 1 
| = 2 X 0.9877 — 1 = 0.9754 
这 时 与 精确 值 0. 9780 较为 接近 ,. 厂 不 作 此 修正 ,可 得 
o — 10 a 15 一 10 
PO<Y, S< 15) =P JE Sh <Er 
= 2®(2. 245) — 1 
= 2 X 0.9794 — 1 = 0. 9588 
这 与 精确 值 0. 9780 HERK. RA ER, AR — PLE O A EA 
公式 是 : 设 Y, ~ bla, p) Biu n A p iE 
np>5Mn(1-pP=>5 
则 二 项 分 布 的 正 态 近似 的 计算 公式 是 
] 
Pla LY, <b) 201 2 ”P 
Mnpll — p) 


5 十 方 一 e 
Vnp(l — p) 


a — mp 


vVnp(1l — p) 


— Q 


| (3.5.3) 


P(Y, <b) =0 (3.5.4) 


| ol 
0021-01 2 d (3.5.5) 


vVnp(l — p) 
例 3.5.3 提前 三 周 以 上 诞生 的 枫 儿 称 为 早产 再 儿 ,某国 新 闻 周 报 (1988 


年 5 月 16 日) 报导 ,该 国 早产 出 儿 占 10% ,假如 随机 选 出 250 个 婴儿 ,其 中 时 
产 贤 儿 数 记 为 X ERKAK 


P0O5 < X <30) 和 P(X 一 20) 
解 :这 里 nn = 250,p= 0.1, H F 


np=25>5, naQ ~—p)=225>5 
故 可 用 正 态 分 布 作 近似 计算 ,其 np = 25,/ atp(] — p) = 4.743 


14.5 — 25 -30.5 — 25 
POS L X < 30) = [13—25 * z- 30.5 — 25 
1554 5 30) =P (Ty zas <A < 


= P(— 2.21 <X* <1.16) 
= (1.16) — [1 — PC. 21) ] 
一 0.8770 — 1 + 0. 9864 

= 0. 8634 


P(X < 20) = P(X <19) = P| X’ < 


= P(X* 一 一 1.16) 
= 1 — (1.16) = 0.1366 
上 述 近 似 计 算 的 示意 图 可 见 图 3. 5. 4(a) 50), 


4=25, 0=4.734 
的 正 态 曲线 
15 25 30 
145 | 30.5 
(a) 
AH =25, 0=4,734 
的 正 态 曲线 
19120 25 
19.5 


(b) 


3.5.4 二 项 分 布 的 正 态 近似 ( 例 3.5.3) 

513.54 某 保 险 公 司 有 10000 个 同龄 又 同 阶层 的 人 参加 人 寿 保 险 , 已 
知 该 类 人 在 一 年 内 死亡 概率 为 0.006 ,每 个 参加 保险 的 人 在 年 初 付 12 元 保险 
费 ,而 在 死亡 时 家 属 可 由 公司 领 得 1000 元 . 问 在 此 项 业务 活动 中 ， 

(1) 保险 公司 亏本 的 概率 是 多 少 ? 

(2) 保险 公司 获得 利润 ( 暂 不 计 管 理 费 ) 不 少 于 40000 元 的 概率 是 多 少 ? 

解 : 在 参加 人 寿 保险 中 把 第 i 个 人 在 一 年 内 死亡 记 为 “X; 二 1”, 一 年 内 仍 
活着 记 为 “X; = 0.0 X; 是 一 个 服从 二 点 分 布 5(1,0. 006) 的 随机 变量 ,其 和 
Xi +X: 十 … + X0000 表示 一 年 内 总 死亡 人 数 。 另 一 方面 ,保险 公司 在 该 项 保 
险 业 务 中 每 年 共 收 入 10000 X 12 = 120000 元 , 故 仅 当 每 年 死亡 人 数 多 于 120 
人 时 公司 才 会 亏本 ; 仅 当 每 年 死亡 人 数 不 超过 80 人 时 公司 获 利 不 少 于 40000 
元 。 由 此 可 知 , 所 要 求 的 概率 分 别 为 
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P(X, 十 中 十 … 十 Xioooo 盖 120) 一 ? 
P(X, +x +“. + X1000 < 80) =? 
由 于 诸 X 是 独立 同 分 布 随 机 变量 ,EC(X,) = 0.006, Var(X;) = 0. 0060 
一 0.006) = 0.005964。 由 德 葛 弗 一 拉 普 拉 斯 定理 和 (3.5.5) 知 
P(X, + X; + + + Xio 之 120) 
_ Xi + X; + -e +Xi000 — 60 120 — 0.5 — 5o 


> 
NV 99. 64 vV 59.64 


= ] — (7.7046) = 0 


, 30 0-360 
P(X X o + X << 80) = p -一 一 一 
(Ar H Xa + *** + X ioo S 80) zo. 64 


= ®(2. 6545) = 0. 9960 
可 见 该 公司 在 这 项 保险 业务 中 亏本 的 概率 近似 于 0, 而 得 利 不 少 于 40000 元 的 
概率 近 于 0. 9960。 

例 3.5.5 报名 听 心 理学 课 的 学 生 人 数 是 服从 均值 为 100( 人 ) 的 泊 松 分 布 。 
负责 这 门 课 程 的 教授 决定 ,如 果 报 名 人 数 超 过 120, 就 分 成 两 班 讲授 ; 如 果 不 超过 
120 人 ,就 集中 在 一 个 班 讲授 ,试问 该 教授 将 讲授 两 个 班 的 概率 是 多 少 ? 

RX 是 均值 为 100 的 泊 松 变量 , 则 所 求 的 概率 为 


P(X > 120) = S o0) e 1% 


:一 121 


这 个 概率 是 难于 计算 ,又 无 胡可 查 。 但 如 想 e” 100 的 泊 松 变量 可 以 分 解 
为 100 个 均值 为 1 的 独立 泪 松 变量 之 和 ( 见 (3. 2. 11) 式 ) ,我 们 就 可 以 利用 中 
心 极 限定 理 求 其 近似 什 。 具 体 是 设 X: ~ PA), i= 1,2) *"",100. M1 X = X, 
十 十 … 十 Xioo 一 已 (100) ,其 已 (X) = Var(X) = 100。, 由 中 心 极限 定理 知 ， 
该 教授 将 分 二 班 讲授 的 概率 为 

P(X>120)=P O =1—9(1. 95)=0. 0256 

913.56 在 随机 模拟 (蒙特 卡 洛 方法 ) 中 经 常 需 要 产生 正 态 分 布 
Na ) 的 随机 数 ,但 一 般 计算 机 只 备 有 产生 区 间 (0,1) 上 的 均匀 分 布 随机 数 
( 常 称 伪 随 机 数 ) 的 软件 ,怎样 通过 均匀 分 布 CO, D 的 随机 数 来 产生 正 态 分 
布 NC5wc) 的 随机 数 呢 ?这 有 多 种 途径 ,下 面 介绍 一 种 用 上 述 中 心 极限 定理 获 
得 N Cua’) 的 随机 数 的 方法 ,具体 操作 如 下 : 

(1) 从 计算 机 中 产生 均匀 分 布 UCO,D 随机 数 12 个 , 记 为 u, ,uw,,… ?212。 

(2) 计算 : 刁 王 妇 十 zz 十 … 十 zs 一 6。 它 可 以 看 作 来 自 标 准 正 态 分 布 
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NC0,1) 的 一 个 随机 数 。 

(3) 计算 :z = 1 十 oF, 由 正 态 分 布 性 可 知 , 它 可 看 作 来 目 正 态 分 布 
N (1,00) 的 一 个 随机 数 。 

(4) 重复 (1) ~ (3)n 次 , 即 得 正 态 分 布 NG, 00 的 7 个 随机 数 ，。 

实际 使 用 表明 ,上 述 产生 正 态 分 布 随机 数 能 满足 实际 需要 , 它 的 关键 是 在 
(2), 它 由 中 心 极 限定 理 得 以 保证 的 。 

例 3.5.7 ”实际 计算 中 ,任何 实数 并 都 只 能 用 一 定位 数 的 小 数 工 近似 ,如 
z = 3. 141592654- Ml e = 2.718281828… 在 计算 中 取 5 位 小 数 , 则 其 近似 数 
Ar = 3. 14159,e' 一 2.71828。 它 们 的 第 6 位 以 后 的 小 数 都 用 四 含 五 入 方法 会 
去 ,这 时 就 会 产生 误差 6 二 z 一 x/'。 假 如 在 市 场 调查 中 (或 水 位 观察 中 ,或 物理 
测量 中 ) 获得 10000 个 用 5 位 小 数 表示 的 近似 数 , 那 末 其 和 的 误差 是 多 少 呢 ? 

这 是 一 个 误差 分 析 问 题 , 当 用 一 个 5 位 小 数 xz’ 近似 表示 一 个 实数 z+ 时 ,其 
误差 = x r 可 看 作 是 区 间 ( 一 0.000005,0. 000005) 上 的 均匀 分 布 ,其 均 
E .方差 和 标准 差分 别 为 

E(e) =0, Var(e) =107™/12, o(e) =0. 2887 X 10 * 
ARR 10000 个 近似 数 之 和 的 总 误差 应 为 &1 十 Es 十 … 十 Eoo RE PiE o 可 看 作 
是 独立 同 分 布 随机 变量 , 其 共同 分 布 就 是 上 述 均匀 分 布 UC o. 000005, 
0. 000005) .这 10000 个 误差 之 和 的 均值 .方差 和 标准 差分 别 为 
Ele + €, + *"* + Ewo) = 0 
Var(el + €, 十 … + €10000) = 10000 X 1071/12 = 104/12 


ole, + €, 十 … 十 Eio) = 10-3/ 412 = 0. 0002887 
EH 林 德 风格 一 列 维 中 心 极限 定理 可 知 . G -+ ez + ... + E10000 )/0. 0002887 近似 
服从 标准 正 态 分 布 NW(0,1), 故 对 给 定 的 &, 有 


P(| Djs] < k X 0.0002887) = D(k) — B(— k) = 20k) — 1 
EH k = 3, 上 式 右 端 为 0. 9974, 因 此 我 们 能 以 99. 74% 的 概率 断言 ¿10000 个 
5 位 小 数 之 和 的 总 误差 的 绝对 值 不 超过 3 X 0. 0002887 = 0. 0008661. 


“3.5.4 ”独立 不 同 分 布下 的 中 心 极限 定理 
现在 我 们 转 入 讨论 独立 但 不 同 分 布 的 随机 变量 序列 场合 下 的 中 心 极限 定理 。 
设 {X,} 是 独立 随机 变量 序列 ,又 设 其 期 望 与 方差 分 别 为 
EA.) = ph Var(X,) =, n= 1,2,. 
依据 独立 性 ,该 序列 前 = 个 随机 变量 之 和 
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600104 |600688|600854|600631|600663 | 600115|600100]600643 
20.40 | 10.24 | 14. 68 - 33 | 32. 98 


1 10.03 | 3.63 4 11.50 
2 10. 3. 57 4. 27 | 32.22 | 11.39 
3 9. 3. 08 4. 32.18 ! 11. 31 
6 9. 3. 99 4. 32.01 | 10.86 
T 9. 3- o8 4. 32. 22 | 10.80 
8 9. 3. 08 4. : 32. 25 j} 10.66 
9 9. 3. 51 4. 32. 35 | 10.45 
10 9. 3.51 4. 34. 21 | 10.57 
13 9. 3. 31 4. 99.02] 10.04 
14 9. 3.66 4. 33. 99 | 10.50 
15 10. 3. 08 4. 35. 63 | 10.70 
16 9. 3.07 4. 36.19 | 10.45 
17 9, 3. 90 4. 35. 58 | 10.50 
21 9. 3. 50 4. 34.50 | 10.11 
ZL 9. 3.51 3. 34. 90 |; 10. 06 
23 9. 3.44 3. 34. 95 | 9.94 
24 9. 3. 41 3. 34.93 | 10.04 
Ll 9. 3. 44 3. 36. 15 | 10. 08 
28 9. 3. 06 3. 35.70 | 10.10 
29 9. 3. 57 3. 35. 90 | 10. 11 
30 9. 3. 3. 36.201 10.43 


清 在 同一 坐标 系 中 作 上 述 8 个 箱 线 图 ,从 中 可 看 出 些 什么 ? 


用 随机 模拟 方法 求 来 自 NCp,0) 总 体 的 容量 为 x = 20 的 样本 偏 度 SK 的 
0.10 与 0.90 的 分 位 数 , 写 出 模拟 计算 的 步 又 。 


没 总 体 和 一 N(wo2) ,从 中 抽取 容量 为 ”的 样本 和 XX BENE 
G — 和 mw X 


S 


EHX = iNX, = AX, 一 不)*. 拟 用 随机 模拟 方法 求 


n= 1 
= ]0 时 G 的 p= 二 0. 95 的 分 位 数 , 设 模拟 次 数 为 10 000 次 , 写 出 模拟 计算 
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并 且 还 有 如 下 极限 
limBs 21E( IX. 19)=0 (3.3. 8) 
则 对 一 切实 数 yA 
limP | 0) Ki) Ly =0(y) 
其 中 u 与 B, 如 前 所 述 。 | 
例 3.5.9 一 份 考卷 由 99 个 题目 组 成 ,并 按 由 易 到 难 顺 次 排列 ， 某 学 生 
答对 第 1 题 的 概率 是 0.99; 答 对 第 2 题 的 概率 是 0. 98; 一 般 地 ,他 答对 第 ; 题 
的 概率 是 1 一 i/100,i 二 1,2,… ,99。 假 如 该 学 生 回 管 各 问题 是 相互 独立 的 ,并 


且 要 正确 回答 其 中 60 个 问题 以 上 (包括 60) 才 算 通 过 考试 。 试 计算 该 学 生 通 
过 考试 的 概率 是 多 少 ? 


解 ; 设 
1， 若 学 生 答对 第 i 题 
X= ¡=1,2,**,99 
0， 若 学 生 答 错 第 ; 题 
于 是 X; 是 二 点 分 布 ， 
P(X;=1)= pi» P(X:=0)=1- Pp, 


其 中 pi 二 1 一 :/100, 因 此 E(X Ð = pi, Var(Xi) 二 pi(1 一 pi)。 为 了 使 其 成 为 随机 
变量 序列 ,我 们 规定 从 Xio 开 始 都 与 和 os 同 分 布 , 且 相 互 独立 ,于 是 


Bi= 2Var(X)= Zpi(l—p) ro (noo) 
另 一 方面 ,上 述 独 立 随 机 变量 序列 {X,} 满 足 李 雅 普 洛 夫 条 件 (3. 5.7) 和 
(3. 5. 8)。 因 为 
E(|X:— p| =p: A — p: + pi(1— p:) 
=p: pDl +H A p: ]Sp: (1—p¡)<oo 
于 是 


A -a Ka 
i Laa) ]” 
故 对 该 序列 ( 瑟 。} 可 以 使 用 中 心 极限 定理 。 另 外 ,可 算得 


99 99 ` 
— _i | _ oo l ,99XxX100_ 
EX)= 2 |1 | 一 99 oo. =49.5 


175 


| o . o 
Ba = 2 Var(X) = >| i) | ; | 


Z 100 


i 99X100X199 
549-5 (100) 6 


而 该 学 生 通 过 考试 的 概率 应 为 
S Esas > 60—49, ] 
= L M16.665  ~v/16. 665 
~1—®(2.5735)=0. 0050 
此 学 生 通 过 考试 的 可 能 性 很 小 ,大 约 只 有 干 分 之 五 的 可 能 性 。 
例 3.5.10 一 位 操作 者 在 机 床上 加 工 机 械 轴 ,使 其 直径 符合 规格 要 求 ， 
但 在 加 工 中 会 受到 一 些 因素 的 影 啊 , 辟 如 : 
在 机 床 方面 有 零件 的 磨损 与 老化 的 影响 ; 
在 刀具 方面 有 装配 与 磨损 的 影响 ; 
在 材料 方面 有 硬度 成份. 产地 的 影 啊 ; 
在 操作 者 方面 有 精力 集中 程度 和 当天 的 情绪 的 影响 ; 
在 测量 方面 有 量具 的 误 郑 .感觉 误差 和 心理 等 影 啊 ; 
在 环境 方面 有 车 间 的 温度 .湿度 .光线 .电源 电压 等 影响 ; 
在 具体 场合 还 可 列 出 一 些 有 影响 的 因素 。 


一 16.665 


A 一 


图 3.5.5 生产 处 于 正常 状态 时 测量 值 的 分 布 


这 些 因素 的 影响 最 后 都 集中 体现 在 测量 值 上 .由 于 这 些 因 素 很 多 ,每 个 对 
测量 值 的 影响 都 是 很 微小 的 ,每 个 因素 的 出 现 都 是 人 们 无 法 控制 的 ,是 随机 
的 ,有 时 出 现 , 有 时 不 出 现 ,出 现时 也 可 能 或 正 或 负 。 这 些 因素 的 影响 使 每 个 加 
工 轴 直 径 的 测量 值 是 不 同 的 ,但 一 组 测量 值 就 会 呈现 正 态 分 布 。 在 生产 处 于 正 
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3.5.6 生产 处 于 不 正常 状态 时 测量 值 的 分 布 
HRS, EF 8:00,10:00,12:00, PF 2:00 所 呈现 出 的 分 布 不 会 随时 间 而 
变 , 见 图 3. 5.5。 当 上 述 诸 因 素 中 有 一 个 或 两 个 对 加 工 起 突出 作用 ,和 璧 如 刀具 
磨损 严重 或 电源 电压 有 较 大 偏差 以 致 影 啊 车 床 转速 ,此 时 测量 值 的 正 态 性 芯 
即 受 到 影响 ( 见 图 3. 5. 6) 。 这 时 就 要 设法 寻找 出 这 一 、 两 个 异常 因素 , 找 出 后 
并 加 以 纠正 ,生产 过 程 又 恢复 正 态 分 布 。 中 心 极限 定理 把 这 个 加 工 过 程 中 所 发 
生 的 现象 从 理论 上 说 清楚 了 ， 


177 


证 守重 a erie ai- a e c = + : 


统计 量 及 其 分 布 


OOOO 


前 三 章 的 研究 属于 “概率 论 ” 的 范畴 ,从 这 一 章 开始 要 转 入 数理 统计 的 研 
究 .数理 统计 与 概率 论 一 样 , 其 研究 对 象 也 是 随机 现象 ,但 研究 方法 不 同 ,在 数 
理 统计 中 是 通过 对 随机 现象 的 观测 或 试验 来 获取 数据 ,通过 对 数据 的 分 析 与 
推断 去 寻找 隐藏 在 数据 中 的 统计 规律 性 。 

例 4.0.1 人 们 的 生活 离 不 开 衣 食 住 行 , 某 市 市 区 为 了 建 井 适合 居民 户 
居住 的 房子 ,首先 就 需要 了 解 该 市 市 区 居民 户 的 人 数 的 分 布 状况 。 我 们 知道 居 
民 户 的 人 数 是 一 个 随机 变量 , 若 采 用 普查 则 工作 量 太 大 ,为 此 可 抽查 部 分 居民 
户 ,通过 这 部 分 居民 户 的 人 数 去 推断 全 市 的 状况 , 即 了 解 该 随机 变量 的 分 布 。 

例 4.0.2 一 个 灯泡 厂 希 望 了 解 本 厂 生 产 的 灯泡 的 寿命 。 由 于 测定 灯泡 
寿命 是 一 种 破坏 性 试验 ,因而 不 可 能 对 每 一 灯泡 进行 测定 ,而 只 能 抽取 者 干 个 
灯泡 作 试 验 , 从 这 几 个 灯泡 的 寿命 数据 去 推断 该 种 灯泡 的 寿命 特征 ,如 平均 寿 
命 等 。 

例 4. 0.3 根据 某 地 环境 保护 法 规定 , 倾 入 河流 的 废物 中 某 种 有 毒化 学 物 
质 含量 不 得 超过 3ppm 。 该 地 区 环保 组 织 对 沿 河 各 厂 进行 检查 ,测定 每 日 倾 入 河 
流 的 废物 中 该 物质 的 含量 。 要 以 此 数据 判断 这 些 三 是 否 符合 环保 法 的 规定 。 

类 似 的 问题 在 生产 活动 和 经 济 活动 中 是 经 常会 遇 到 的 ,数理 统计 就 是 在 
解决 这 些 实际 问题 中 逐渐 形成 了 一 门 独立 的 学 科 。 从 理论 上 讲 , 如 果 我 们 对 某 
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随机 现象 进行 大 量 观测 或 试验 ,那么 我 们 可 以 清楚 地 掌握 其 统计 规律 性 ,然而 
在 实际 中 常常 是 办 不 到 的 ,只 能 得 到 有 限 的 甚至 少量 的 数据 ,这 部 分 数据 必然 
带 有 随机 性 ,为 此 需要 我 们 从 中 尽 可 能 排除 随机 性 的 于 执 以 作出 合理 的 推 朵 。. 
这 便 是 数理 统计 所 要 研究 的 内 容 。 可 以 这 样 讲 , 数 理 统计 是 研究 怎样 以 有 效 的 
方式 收集 、 整 理 \ 分 析 带 随机 性 的 数据 ,并 在 此 基础 上 ,对 所 研究 的 问题 作出 统 
计 推 源 ,直至 对 可 能 作出 的 决策 提供 依据 或 建议 。 简 单 地 讲 ,数理 统计 就 是 研 
究 处 理 数 据 的 一 门 学 问 ,而 概率 论 为 数据 处 理 提供 了 理论 基础 。 
本 章 主 要 介绍 数理 统计 的 一 些 基 本 概念 和 数据 处 理 的 一 些 初 步 的 方法 。 


S41 总 体 与 样本 


4. 1.1 总 体 与 个 体 

在 一 个 统计 问题 中 ,我们 把 研究 对 象 的 全 体 称 为 总 体 ( 也 称 为 母体 ) ,构成 
总 体 的 每 个 成 员 称 为 个 体 。 然 而 在 我 们 的 研究 中 往往 关心 的 是 每 一 成 员 的 某 
个 数量 指标 ,因而 将 个 体 所 具有 的 数量 指标 的 全 体 作 为 一 个 总 体 , 而 每 一 成 员 
的 指标 就 是 一 个 个 体 。 

随 着 研究 问题 的 不 同 ,总 体 也 会 有 所 不 同 。 

例 4.1.1 在 研究 上 海 市 人 口 的 年 龄 构成 中 ,可 以 把 每 个 具有 上 海 市 户 
籍 的 人 的 年 龄 看 成 一 个 个 体 , 上 海 市 有 1200 多 万 人 ,如 果 每 个 人 的 年 龄 写 在 
一 张 小 条 子 上 放 在 一 个 大 口袋 中 ,那么 其 中 就 有 1200 多 万 个 数据 ,其 全 体 便 
构成 一 个 总 体 。 如 果 我 们 要 分 别 研 究 上 海 市 男性 人 口 与 女性 人 口 的 年 龄 构成 ， 
那么 应 将 男性 年 龄 的 条 子 与 女性 年 龄 的 条 子 分 别 放 在 两 个 口袋 中 ,从 而 形成 
了 两 个 总 体 ,一 个 供 研 究 男 性 人 口 的 年 龄 构成 用 ,一 个 供 研究 女性 人 口 的 年 龄 
构成 用 。 总 体 中 每 一 年 龄 的 人 数 是 不 同 的 。 图 4.1. 1 是 根据 上 海 市 1990 年 人 
口音 碍 资料 作出 的 人 口 年 龄 的 分 布 图 ,左边 是 男性 人 口 的 年 龄 分 布 ,右边 是 女 
性 人 口 的 年 龄 分 布 , 从 图 中 可 看 出 上 海 市 人 口 分 布 的 一 些 特点 ,譬如 ;各 年 龄 
上 有 、 女 人 数 类 似 ; 在 高 年 龄 上 女性 多 于 男性 ;30 一 40 岁 的 人 数 较 多 ( 即 在 
1950 一 1960 年 间 出 生 的 人 较 多 ,形成 了 一 个 生育 高 峰 ) 等 。 

现实 世界 中 的 总 体 有 许多 ,但 是 从 总 体 中 所 包含 的 个 体 个 数 看 ,总 可 分 成 
两 类 :一 类 是 有 限 总 体 , 一 类 是 无 限 总 体 。 上 面 的 例子 中 ,总 体 中 的 个 体 数 尽管 
很 多 ,但 总 是 有 限 的 。 然 而 在 不 少 情 况 下 ,总体 中 的 个 体 个 数 可 以 认为 是 无 限 
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图 4. 1. 1 1990 年 上 海 男 性 与 女性 年 龄 分 布 图 
的 ,譬如 研究 某 工厂 生产 的 同型 号 的 电视 机 的 寿命 来 讲 ,总 体 不 仅 包 括 了 已 经 
生产 的 每 一 台电 视 机 的 寿命 ,还 包括 了 正在 生产 和 将 要 生产 的 每 台电 视 机 的 
寿命 ,因此 其 个 体 数 是 无 限 的 。 有 限 总 体 的 情况 将 在 “抽样 调查 ”中 研究 ,在 我 
们 这 门 课程 中 研究 的 总 体 总 认为 是 无 限 总 体 。 

例 4.1.2 设 电 视 机 生产 厂家 关心 的 是 其 生产 的 彩色 电视 机 是 否 合 格 ， 
我 们 将 一 台 彩 电 合格 记 为 0, 不 合格 记 为 1。 那么 该 厂 生 产 的 彩电 质量 这 一 总 
体 可 以 用 装 有 许多 0 与 1 的 伐 子 来 表示 。 不 同 的 彩电 生产 厂家 总 体 的 差别 在 
于 袋子 中 1 所 占 的 比率 p 的 不 同 ,这 个 p 便 是 厂家 生产 的 彩电 的 不 合格 品 
率 。 从 而 一 个 厂家 生产 的 彩电 的 质量 就 可 以 用 一 个 二 点 分 布 5(1,p) 来 表示 : 

X 0 1 

P 1—p p 
其 中 XX 是 一 个 随机 变量 ,表示 抽查 一 台 彩 电 的 质量 后 所 得 到 的 不 合格 数 ,X 
一 0 表示 该 台 彩 电 合 格 ,X==1 表示 该 台 彩 电 不 合格 。 不 同 厂家 的 总 体 间 的 差 
异 就 体现 在 不 同 的 p E, 

例 4.1.3 SONY 牌 彩电 有 两 个 产地 :日 本 与 美国 ,两 地 的 工厂 是 按 同 一 
设计 方案 和 相同 的 生产 线 生 产 同 一 牌号 SONY 电视 机 , 连 使 用 说 明 书 和 检验 
合格 的 标准 也 都 是 相同 的 。 芯 如 彩电 的 彩色 浓度 Y 的 目标 值 为 m, 公 差 ( 允 许 
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的 波动 ) 为 5, 当 YY 在 公益 范围 [ 闷 一 5,m 十 5] 内 该 彩电 的 彩色 浓度 为 合格 ,和 否 
则 判 为 不 合格 。 

两 地 产 的 SONY 牌 彩电 在 美国 市 场 中 都 能 买 到 ,到 70 年 代 后 期 ,美国 消 
费 者 购买 日 本 产 SONY 彩电 的 热情 高 于 购买 美国 产 SONY 彩电 。 这 是 什么 
原因 呢 ? 1979 4 A 17 日 日 本 《朝日 新 闻 》 刊 登 了 这 一 问题 的 调查 报告 ,报告 
指出 :日 产 的 彩色 浓度 了 服从 正 态 分 布 N(m,(5/3)?), 而 美 产 的 彩色 浓度 Y， 
HITA U m— 51 m+ 5) (1H 4.1.2)。 这 两 个 不 同 分 布 表 示 着 两 个 不 同 
总 体 。 这 两 个 总 体 的 均值 相同 ,都 为 mx, 但 方差 不 同 。 


5 2 
Var(Y)=| 5) =2.78, o(Y,)=1.67 


Vary) =12 8, 33, o(Y,)=2.89 


可 见 , 日 产 的 彩色 浓度 的 方差 小 于 美 产 的 彩色 浓度 的 方差 ， 从 而 在 I 级 品 数量 
E HP" SONY 是 美 产 SONY 的 两 倍 ,这 就 是 美国 消费 者 乐于 购买 日 产 
SONY 的 主要 原因 。 


各 等 级 彩电 的 比率 
等 级 | I Mm 1 
美 产 33.3% 33.3% 33.3% 0 
y H= 68.3% 27.1% 4.3% 0.3% 
日 产 SONY 
SONY 
Y 
y | 
Oo 
E p mia 彩色 浓度 
Vy—+ 
NV E I I H HH NY 


4.1.2 SONY 电视 机 彩色 浓度 分 布 图 


为 什么 两 个 工厂 按 同 一 设计 方案 、 相 同 设备 生 产 同一 种 电视 机 ,其 彩色 浓 
度 会 有 不 同 的 分 布 呢 ? 关键 在 于 管理 者 ,美国 SONY 生产 厂 的 管理 者 按 彩色 
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浓度 合格 范围 [mx 一 5,m 十 5j 要 求 操 作 , 在 他 看 来 ,只 要 彩色 浓度 在 此 区 间 内 ， 
不 管 它 在 区 间 内 什么 位 置 都 认为 合格 ,因而 造成 彩电 浓度 落 在 这 个 区 间 内 任 
一 相同 长 度 小 区 间 内 的 机 会 是 相同 的 ,从 而 形成 均匀 分 布 。 但 日 产 SONY 的 
管理 者 认为 ,彩色 浓度 的 最 佳 位 置 在 m 点 上 ,他 要 求 操作 者 把 彩色 浓度 尽量 
Em 靠近 ,这 样 一 来 ,彩色 浓度 在 m 周围 的 机 会 就 多 ,而 远离 m 的 机 会 就 少 ， 
最 后 的 总 体 呈 正 态 分 布 。 

上 述 的 无 限 总 体 是 由 一 堆 数 组 成 的 ,其 中 有 些 数 可 以 相间 ,但 是 各 种 不 同 
值 的 数 在 总 体 中 所 占 的 比例 不 同 . 因 此 为 了 清楚 地 表示 总 体 ,可 以 用 随机 变量 
X 或 其 概率 分 布 来 表示 总 体 。 当 用 随机 变量 X 表示 总 体 时 ,可 以 简称 总 体 义 ， 
如 采 关 的 分 布 函 数 为 (zx), 那么 F(x) 也 是 总 体 的 分 布 函 数 , 所 以 也 可 以 用 
(x) 表示 一 个 总 体 。 壁 如 当 描 述 总 体 的 随机 变量 X 服从 正 态 分 布 时 ,也 称 该 
总 体 为 正 态 总 体 ;今后 称 * 从 某 总 体 中 抽样 ”也 可 称 “ 从 某 分 布 中 抽样 ”。 

在 统计 中 ,用 来 描述 总 体 的 分 布 通常 是 未 知 的 ,因此 确定 总 体 的 概率 分 布 
就 是 统计 所 要 研究 的 一 个 问题 有 的 总 体 的 分 布 类 型 是 已 知 的 ,但 是 其 中 的 参 
数 未 知 , 那 时 就 要 研究 如 何 确定 总 体 的 参数 .譬如 在 例 4.1. 2 中 总 体 服 从 的 是 
二 点 分 布 , 但 是 参数 p 是 未 知 的 ,因此 需要 我 们 去 确定 pe 

在 有 些 问 题 中 ,我 们 对 每 一 研究 对 象 可 能 要 观测 两 个 或 多 个 指标 , 则 可 用 
多 维 随机 向 量 (X， Az)” ;六 sp) 去 描述 总 体 ,也 可 用 其 联合 分 布 ESE F (x1, £2, 
…，Tp) 去 描述 总 体 , 这 种 总 体 称 为 p 维 总 体 .例如 我 们 对 每 一 居民 户 需 研究 四 
个 指标 :Xi: 一 月 收入 ,和 X: 一 月 支出 ,X: 一 居住 面积 ,X, 一 人 数 , 则 可 用 四 维 随机 
问 量 (Xi:,X2:,X3s,X4) 去 描述 所 要 研究 的 总 体 。 这 是 “ EAT 
本 书 主 要 研究 一 维 总 体 , 有 时 会 涉及 二 维 总 体 。 


4.1.2 样本 

由 于 总 体 可 以 用 随机 变量 来 描述 ,因此 研究 总 体 就 要 研究 义 的 分 布 或 
分 布 的 某 些 特征 量 。 如 果 我 们 能 对 总 体 中 每 一 个 个 体 进 行 观察 , 那 当 然 可 以 了 
解 总 体 ,就 象 例 4. 1.1 那样 ,为 了 解 具有 上 海 市 户籍 的 人 的 年 龄 ,进行 一 次 人 
口 普查 ”, 就 可 以 得 到 每 一 个 人 的 年 龄 , 画 出 如 图 4. 1. 1 那样 的 图 形 , 就 可 以 
了 解 总 体 的 分 布 情况 。 然 而 这 在 许多 情况 中 是 没有 必要 的 (如 例 4.0.1, 要 花 
费 大 量 的 人 力 、 物 力 ) 或 根本 不 可 能 (如 例 4. O. 2, 要 测定 每 个 灯泡 的 寿命 必须 
进行 破坏 性 试验 )。 因 此 把 “普查 ” 改 为 “抽样 ”是 一 种 可 行 的 办 法 , 即 从 总 体 中 
抽出 者 干 个 个 体 , 对 这 些 个 体 ( 样 品 ) 进 行 观察 ,然后 对 总 体 进行 推断 ， 

人 总体 中 抽出 的 部 分 个 体 组 成 的 集合 称 为 样本 (也 称 子 样 ) ,样本 中 所 含 
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的 个 体 称 为 样品 ,样本 中 样品 的 个 数 称 为 样本 容量 (也 称 样本 量 )。 

例 4.1.4 样本 的 一 些 例子 与 观察 值 的 表示 方法 : 

(1) 某 食品 厂 用 自动 装 镶 机 生产 净重 为 345 克 的 午餐 肉 铅 头 ,由 于 随机 
性 ,每 个 镀 头 的 净重 都 有 差别 。 现 在 从 生产 线 上 随机 抽取 10 个 钠 头 , 秤 其 净 
重 , 得 如 下 结果 . 

344 336 345 342 340 338 344 343 344 343 

这 是 一 个 容量 为 10 的 样本 的 观察 值 , 它 是 来 自 该 生产 线 钢 头 净 重 这 一 总 
体 的 一 个 样本 的 观察 值 。 

(2) 对 某 型 号 的 20 辆 汽车 记录 每 加 仑 汽油 各 自行 驶 的 里 程 数 (单位 : 公 
里 ) 如 下 : 

29.8 27.6 28.3 28.7 27.9 30.1 29.9 28.0 28.7 27.9 

28.5 29.5 27.2 26.9 28.4 27.8 28.0 30.0 29.6 29.1 

这 是 一 个 容量 为 20 的 样本 的 观察 值 , 对 应 的 总 体 是 该 型 号 汽车 每 加 仑 汽 
油 行驶 的 里 程 。 

(3) 对 363 个 零售 商店 调查 周 零售 额 ( 单 位: 元) 的 结果 如 下 : 


<1 000 (1 000,5 000](5 000,10 000](10 000,20 000 1(20 000,30 000] 


这 是 一 个 容量 为 363 的 样本 的 观察 值 ,对 应 的 总 体 是 所 有 有 零售 店 的 周 堆 
售 额 .不 过 这 里 没有 给 出 每 一 个 样品 的 具体 的 观察 值 ,而 是 给 出 了 样本 观察 值 
所 在 的 区 间 , 称 为 分 组 样本 的 观察 值 。 这 样 一 来 当然 会 损失 一 些 信息 ,但 是 在 
样本 量 较 大 时 ,这 种 经 过 整理 的 数据 更 能 使 人 们 对 总 体 有 一 个 大 致 的 印象 .这 
种 数据 整理 方法 将 在 本 节 后 面部 分 来 叙述 。 

(4) 对 110 只 某 种 电子 元 件 进 行 寿命 试验 ,其 失效 时 间 经 过 分 组 整理 后 如 下 ; 


0 一 400 
400—800 
3800 —1 200 
1 200—1 600 
1 600—2 000 
2 000—2 400 
2 400—2 800 
2 800 —3 200 


0 N o NM $ o N m 
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这 是 一 个 容量 为 110 的 样本 观察 值 ,对 应 的 总 体 是 某 电子 元 件 的 寿命 ,这 
也 是 一 个 分 组 样本 ,在 分 组 中 习惯 上 包括 组 的 右 端 点 ,而 不 包括 左 端点 , 辟 如 
400—800 为 半 开 区 间 (400,800j]。 

在 样本 中 常用 n 表示 样本 容量 ,从 总 体 中 抽出 的 容量 为 的 样本 记 为 于 
= (X1 X200 XD ,这 里 每 个 X 都 看 成 是 随机 变量 ,因为 第 : 个 被 抽 到 个 体 
具有 随机 性 ,在 观察 前 是 不 知 其 值 的 。 样 本 的 观察 值 记 为 x= (zi,zs，… ,x,)， 
上 面 例 子 中 给 出 的 都 是 样本 的 观察 值 。 

我 们 抽取 样本 的 目的 是 为 了 对 忆 体 进行 推 斯 。 为 了 能 从 样本 正确 推断 总 
体 就 要 求 所 抽取 的 样本 能 很 好 地 反映 总 体 的 信息 ,所 以 要 有 一 个 正确 的 抽取 
样本 的 方法 .最 常用 的 抽取 样本 的 方法 是 “简单 随机 抽样 ”, 它 要 求 抽 取 的 样本 
MEM PER: 

第 一 ,要 有 代表 性 , 即 要 求 每 一 个 体 都 有 同等 机 会 被 选 入 样本 ,这 便 意味 
着 每 一 样品 X 与 总 体 有 相同 的 分 布 ,这 样 的 样本 便 具有 代表 性 。 

第 二 ,要 有 独立 性 , 即 要 求 样本 中 每 一 样品 取 什 么 值 不 受 其 它 样品 取 值 的 
影 啊 , 这 便 意 味 着 XXt Xn 相互 独立 。 

用 简单 随机 抽样 方法 获得 的 样本 称 为 简单 随机 样本 ,简称 样本 ,这 时 XX， 
X20 X, 可 以 看 成 是 相互 独立 的 具有 同一 分 布 的 随机 变量 ,简称 它们 为 独立 
同 分 布 ( 简 记 为 iid) 样 本 。 设 总 体 六 的 分 布 函 数 为 F(x), 则 样本 XX, 
X, HER IATA 


A EZES 


在 实际 中 为 获得 简单 随机 样本 可 设想 一 种 原始 的 作法 。 壁 如 一 批 灯泡 有 
600 个 ,要 从 中 抽 6 个 作 寿 命 试 验 ,这 6 个 灯泡 如 何 选 呢 ? 为 此 可 对 这 600 个 
灯泡 编 上 号 1 一 600, 另 准备 600 个 大 小 质地 完全 相同 的 球 , 球 上 依次 写 上 1 一 
600 ,将 它们 放 入 一 个 不 透明 的 袋子 中 ,并 彻底 搅乱 ,然后 从 中 取出 6 个 球 来 ， 
这 6 个 球 上 的 号 码 对 应 的 6 个 灯泡 便 取 出 进行 试验 ,这 6 个 灯泡 的 寿命 就 构 
成 容量 为 6 的 样本 。 

然而 在 实际 中 要 准备 这 么 多 球 , 还 要 彻底 搅乱 ,这 并 不 是 一 件 容易 的 事 ， 
为 此 有 两 种 方案 可 用 。 

方案 一 :利用 “随机 数 表 ”, 本 书 附 表 ?7 是 一 大 本 随机 数 表 中 的 一 页 。 我 们 
可 从 该 表 任 意 位 置 开始 读数 . 仍 假 定 要 从 600 个 灯泡 中 抽 6 个 , 设 现 从 该 表 的 
第 一 行 第 一 列 开 始 , 以 三 列 为 一 个 数 ,从 上 到 下 读 出 ， 

537,633,358 ,634,982,026,645,850,585,358,039,626,084.,--- 
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凡 其 值 大 于 600 的 便 跳 过 ( 数 下 划一 ) ,如 出 现 的 数 与 前 面 重复 的 也 跳 过 ( 数 下 
划 二 ), 直 到 选 出 6 个 不 超过 600 的 不 同 的 数 为 止 。 现 可 将 编号 为 537,358, 
026,585,039,084 的 六 个 灯泡 取出 测定 其 寿命 。 

方案 二 :可 利用 计算 机 产生 6 个 1 一 600 间 的 不 同 的 随机 整数 ,取出 它们 
对 应 的 灯泡 进行 试验 ,测定 它们 的 寿命 。 


4.13 从 样本 去 认识 总 体 

样本 来 自 总 体 ,因此 样本 中 必 包 含 了 总 体 的 信息 ,因此 我 们 希望 通过 样本 
的 观测 值 zi ,xzx2,… ,za 来 获得 有 关 总 体 分 布 类 型 或 有 关 总 体 特 征 值 的 信息 。 
然而 样本 观测 值 是 一 组 数 , 粗 看 可 能 是 杂乱 无 章 的 ,因此 必须 对 它 进行 整理 与 
加 工 后 才 会 显示 出 规律 整理 加 工 的 方法 有 图 表 法 与 统计 量 。 本 他 介绍 对 数 
据 整 理 的 图 表 方 法 ,以 显示 样本 所 来 自 的 总 体 分 布 的 信息 。 

4.1.3.1 频数 频率 分 布 表 及 其 图 示 

MAGA X 是 离散 随机 变量 , 设 其 一 切 可 能 取 值 为 ai,as，… ,ai, 则 对 数 
据 整 理 的 一 般 方法 是 统计 在 样本 观察 值 zyzz，……,z PE a; 的 个 数 , 称 为 频 
数 , 常 记 为 m1(1 二 1,2,…,k)。 为 了 便于 比较 ,通常 还 计算 其 频率 finn AR 
它们 列 成 一 张 表格 , 称 为 频数 、 频 率 分 布 表 ( 见 表 4. 1.1). 

例 4.1.5 我 们 通常 饮用 的 矿 果 水 有 19 个 质量 指标 。 某 市 技术 监督 局 一 
次 抽查 了 58 批 矿 果 水 ,记录 每 一 批 矿 泉水 的 每 个 指标 是 否 合格 ,从 中 可 统计 
出 每 批 矿 果 水 不 合格 指标 的 个 数 AX. KE X 是 一 个 离散 随机 变量 ,其 一 切 可 
能 取 值 为 0,1,… ,19。58 批 矿泉 水 的 指标 不 合格 数 tire ,xs8 槐 成 了 一 个 
容量 为 58 的 样本 的 观测 值 ,每 个 xz; 可取 0,1,…,19 中 某 个 值 ,将 它们 整理 后 
列 成 表 4. 1. 1。 

表 4. 1.1 58 批 矿泉 水 不 合格 指标 数 的 频数 、 频 率 分 布 表 


指标 不 合格 数 a 频数 n 频率 f; 二 nj/n 
0 33 | 0. 570 
1 17 0. 293 
2 5 0. 086 
3 ] 0. 017 
4 2 0. 034 
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从 表 4. 1.1 可 以 看 出 各 项 指标 全 部 合格 的 矿 录 水 占 57%%, 仅 一 项 指标 不 
合格 的 占 29. 3 上 %% ,两 者 合计 占 86.3%, 
为 直观 起 见 ,可 用 线条 图 (图 4. 1. 3 表示 ,其 横 坐 标 为 X 的 取 值 , 纵 坐 标 


频数 频率 
40 
0.6 
30 0.5 
0.4 
20 
0.3 
10 0.2 
0.1 


0 l 2 3 4 


图 4.1.3 例 4.1.5 的 线条 图 

DADA X 是 连续 随机 变量 , 则 其 取 值 可 以 充满 某 一 区 间 , 从 而 无 法 一 
一 列 出 它们 的 取 值 ,这 时 数据 整理 的 一 般 方 法 是 进行 分 组 统计 ,将 其 可 能 取 值 
分 成 k 个 小 区 间 : (ao ,Q1]， Car saz] ys (ar~) sar] ,统计 L1i9LTL29**" 9 Tn 落 在 每 一 
小 区 闻 中 的 频数 ,并 计算 其 频率 ,通常 也 列 成 表格 形式 ,其 一 般 步 又 见 
例 4. 1. 6。 

例 4.1.6 上 海 证 券 交 易 所 将 每 天 各 种 股票 的 交易 价格 概括 为 一 个 综合 
指标 , 称 为 “上 证 指数 ”, 如 果 今 天 的 上 证 指数 为 y, 而 上 一 个 交易 日 的 上 证 指 
数 为 y , 则 称 2=9— y 为 上 证 指数 的 涨 跌 值 。 下 面 的 数据 便 是 上 海 证 券 交 易 
所 1995 年 头 50 个 交易 日 上 证 指数 涨 跌 的 观测 值 (摘自 新 民 了 晚报 )， 


13.93 一 6.92 一 6.13 一 14.79 —15.70 —2.83 一 11.01 —4.28 —9.03 —0.87 
5.70 一 21.92 一 0.48 一 17.80 —5.87 8.20 一 2.67 —28.87 —1.23 1.26 
19.61 一 11.98 7.46 一 0.73 —5.27 —4.47 —4.61 1.20 6.18 53.50 
—5.51 —30.70 2.84 —12.01 7.70 3.89 16.37 39.08 16.66 —12.15 
一 15.22 —19.30 —0.06 2.01 —15.64 7.28 13.64 —8.07 6.50 21.75 


由 于 上 证 指数 的 涨 跌 是 一 个 连续 随机 变量 ,因而 我 们 采用 分 组 方法 进行 
整理 ,具体 步 又 如 下 : | 
(DRA LLL 中 的 最 小 值 rwm JAAK T(n) ;并 计算 极 差 no 
在 本 例 中 n=50, £= — 30.70, £e =53. 50, Rso=53. 50 一 (一 30.70) 二 
84.20, 
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(2) 根 据 样本 容量 ”确定 分 组 数 &。 这 里 有 一 个 推荐 公式 : 
& 一 1 十 3. 322lgn 


EA tk PAE: 
n k 
<50 D~ 6 
50~100 6~10 
100~250 7 一 12 
>250 10~ 20 


在 本 例 中 n=50, W4 6~10 组 , 现 取 有 一 9。 

(3) 确 定 各 组 端点 aoa Lear A a 过 zo) sat 之 xm; 分 组 可 以 等 间 
隔 亦 可 不 等 间隔 ,等 间隔 用 得 较 多 , 在 等 间隔 分 组 时 ,组 距 dR,/& ,一 般 总 取 
d 为 数据 的 最 小 测量 单位 的 整数 倍 。 


在 本 例 中 , BX ai 一 一 — 35 ad=% 10, N 2; 一 00 十 10z7 一 ] VARIZ 19. 


(4 用 唱 票 法 统计 落 在 每 一 区 间 (a- 101) ,i 一 1,2,…,k 中 的 频数 ni, 并 计 
算 频率 f:==n./n, 将 它们 列 成 分 组 统计 的 频数 频率 分 布 表 。 
本 例 的 频数 \ 频 率 分 布 表 见 表 4. 1. 2。 


Y 4.1.2 1995 年 头 50 个 交易 日 上 证 指数 涨 跌 分 组 频数 频率 分 布衣 


1 (— 35, —25] 2 0. 04 

2 (—25,—15] 6 0. 12 

3 (一 15 ,一 5] 12 0. 24 

4 (—5,5] 15 0. 30 

5 (5,15] 9 0. 18 

6 (15,25] 4 0. 08 

7 (25,35] 0 0. 00 

8 (35,45] 1 0. 02 

E 9 (45,55] 1 0. 02 
£ H 1. 00 


当 总 体 是 连续 随机 变量 时 ,为 直观 起 见 ,也 常用 图 形 来 表示 ,常用 的 有 两 
种 图 形 
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”图 形 一 :样本 直方 图 。 


样本 直方 图 (简称 直方 图 ) 的 作法 如 下 ARA LALA PA AAA 
dosd» ”” ,ak 对 每 一 组 以 XX JB) (Ai: ai 1X JE , 以 频数 rli J Au — EJE HA 
标的 尺度 标 为 f:/4, 即 频率 /组 距 。 图 4.1. 4(a) 便 是 例 4. 1.6 的 直方 图 。 


(a) 频率 /10 


A 


-35 -15 515 35 59 
-25 -9 29 45 


(b) 频率 /10 


-55 -35 -15 515 35 55 ` 


-45 -25 -5 25 45 


(c) 频率 /5 


+ 


-55 -35 -15 
-45 -25 


15 35 55 
-b9 25 45 


4.1.4 样本 直方 图 


当 纵 坐标 取 为 频率 /组 距 时 ,直方 图 图 
形 有 一 个 很 方便 的 解释 。 这 时 每 一 个 小 的 
和 矩形 的 面积 恰 为 数据 落 在 该 区 间 的 频率 ， 
所 有 小 矩形 的 面积 之 和 为 1。 样 本 直方 图 
的 具体 形状 会 随 样本 观测 值 的 不 同 而 有 所 
变化 ,但 当 n 越 来 越 大 时 ,分 组 可 越 来 越 
多 ,此 时 组 距 将 越 来 越 小 ,从 而 样本 直方 图 
顶部 折线 将 会 逐渐 趋向 一 条 稳定 的 曲线 ， 
这 条 曲线 便 是 总 体 对 应 的 概率 密度 曲线 ， 
所 以 样本 直方 图 可 以 看 成 总 体 分 布 的 一 个 
缩影 。 

对 例 4.1. 6, 我 们 可 以 扩大 样本 容量 ， 
图 4.1.4(b) 与 (c) 是 对 应 于 样本 容量 n= 
100 与 200 时 的 样本 直方 图 ,前 者 组 距 为 
10, 后 者 组 距 为 5。 人 队 图 4. 1. 4 的 三 个 样本 
直方 图 可 见 , 图 形 随 样本 观测 值 不 同 略 有 
差 腊 ,但 基本 形状 差不多 ,呈现 了 “中 间 高 、 
两 边 低 、 左 右 基本 对 称 ” 的 特点 ,也 可 想象 
当 n 更 大 时 ,顶部 折线 会 趋 于 正 态 曲线 ,这 
表明 样本 对 应 的 总 体 很 可 能 为 正 态 总 体 。 

样本 直方 图 显示 的 形状 除了 上 述 的 形 
状 外 还 有 其 它 的 形状 , 壁 如 样本 直方 图 有 
单调 下 降 趋 势 时 可 能 为 指数 分 布 ( 图 


4. 1. 5); 如 果 中 间 高 ,两 边 低 ,但 左右 不 对 称 , 右 尾 长 时 可 能 为 对 数 正 态 分 布 
(图 4. 1.6) 等 。 总 之 ,从 样本 直方 图 的 形状 可 使 我 们 对 总 体 的 分 布 类 型 有 一 个 


大 致 的 认识 。 


例 4.1.7 画 出 例 4.1.4(4) 中 的 样本 直方 图 ( 见 图 4.1.7) ,可见 它 不 对 
称 , 右 尾 较 长 ,有 可 能 该 样本 来 自 对 数 正 态 分 布 。 
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频率 /组 距 


图 4.1.5 来 自 指数 分 布 的 直方 图 图 4.1.6 来 目 对 数 正 态 分 布 的 直方 图 
频率 /组 距 


O 400 800 1200 1600 2000 2400 2800 3200 
4.1.7 例 4.1.4(4) 的 样本 直方 图 


图 形 二 : 蕉 叶 图 (又 称 枝 叶 图 ) 。 

茎 叶 图 是 男 一 种 数据 整理 用 的 图 形 ,在 这 张 图 上 保留 了 原始 数据 的 信息 ， 
从 而 可 为 我 们 提供 有 关 总 体 的 更 多 的 信息 。 下 面 先 通过 一 个 例子 来 说 明 其 作 
法 。 

例 4.1.8 对 某 型 号 的 20 辆 汽车 记录 了 各 自 每 加 仑 汽油 行驶 的 里 程 数 

29.8 27.6 28.3 28.7 27.9 29.9 30.1 28.0 28.7 27.9 

28.5 29.5 27.2 26.9 28.4 27.9 28.0 30.0 29.6 29.1 
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为 作 葵 叶 图 ,需要 把 每 个 数据 分 成 两 个 部 分 ,高 位 部 分 称 为 “ 茎 ”, 低 位 部 分 称 
为 “ 叶 ”, 为 此 先 考 察 一 下 数据 ,发 现 数据 在 26 一 31 间 ,因此 可 对 数据 作 如 下 划 
分 ,以 第 一 个 数据 为 例 : 
数据 分 开 == MH 
29.8 一 2918 一 2958 
AAR, CREAR UN EA IAF A ARE RACE 
NA o RD EI IK SF 
HEJ, FR ERM, AAA EE HH A 4.1.8 WEHE RLE 4.1.8, 
26 | 9 
27 | 26999 
28 | 0034577 
29 | 15689 
30 | 01 
莹 的 单位 =1 | 叶 的 单位 一 1 


图 4.1.8 例 4.1.8 的 艺 叶 图 

我 们 可 以 将 鞋 叶 图 看 成 一 张 转 了 90° 的 直方 图 ,只 是 在 图 4. 1. 8 中 每 组 区 
闻 为 [26,27) ,[27,28),[28,29),[29,30),[30,31) 而 已 ,但 在 蔡 叶 图 中 不 仅 给 
出 了 落 在 各 区 间 的 频数 ,还 给 出 了 该 区 间 中 每 一 个 具体 的 观测 值 .从 图 中 可 看 
出 此 分 布 是 对 称 的 ,中间 高 .两边 低 , 从 而 可 以 设想 总 体 分 布 可 能 是 正 态 的 。 

在 图 4.1.8 中 实际 上 已 经 将 样本 观察 值 从 小 到 大 排列 了 ,最 小 值 是 
26. 9, 最 大 值 是 30.1, 人 它 还 可 以 提供 更 多 的 信息 ,这 将 在 后 面 及 § 4. 3 中 进行 
讨论 。 

4.1.3.2 经 验 分 布 鸭 数 

翌 本 直方 图 可 以 形象 地 去 描述 总 体 概 率 密 度 函 数 的 大 致 形状 ,经 验 分 布 
函数 将 可 以 用 来 描述 总 体 分 布 函 数 的 大 致 形状 。 

定义 4.1.1 设 总 体 久 的 分 布 函 数 为 F(x), 从 中 获得 的 样本 观测 值 为 
Ar Xs， 将 它们 从 小 到 大 排列 成 ro Sro Le Stew, S 


O, TLT | 
F,(12)=3k/n, tS<tilarmn) k=1,2,"""»n—1 (4.1.1) 


l, LZA (5) 


则 称 Fo HAERERAA. 
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经 验 分 布 函 数 玉 (z) 在 工 点 的 函数 全 其 实 就 是 观测 值 zi,zz，……zn 中 小 
于 等 于 z+ 的 频率 , 它 是 一 个 右 连续 的 非 降 函 数 , 且 0 志 F,(x) 志 1, 因 而 它 具有 
分 布 函 数 的 性 质 ,我 们 可 以 将 它 看 成 是 以 等 概率 取 zzz 的 离散 随机 
变量 的 分 布 函数 。 经 验 分 布 函 数 的 图 象 是 一 个 非 降 右 连续 的 阶梯 函数 。 
例 4.1.9 例 4.1.4(1) 的 经 验 分 布 靖 数 为: 
O, 336 
0.1, 33621<338 
0.2, 338<1<340 
0.3, 340<1<342 
F, C(x) = (4, 1. 2) 
0.4, 342<1<343 
0.6, 3432<1<344 
0.9, 34421345 
l, z345 


其 图 象 如 图 4.1.9 所 示 。 
F, (x) 


4.1.9 例 4.1.4(1) 的 经 验 分 布 函数 


表面 已 提 到 对 连续 总 体 筷 而 言 , 当 样本 观测 值 不 同时 ,直方 图 形态 会 有 
所 不 同 ,但 只 要 样本 容量 ” 增 大 ,分 组 越 来 越 多 ,每 一 小 区 间 长 度 越 来 越 小 时 ， 
直方 图 顶部 折线 会 稳定 于 总 体 密度 函数 ,同样 , 随 样本 观测 值 不 同 ,经 验 分 布 
KA F,(z) 也 不 同 , 但 只 要 样本 容量 增 大 ,那么 F,(z) 也 将 在 概率 意义 下 载 
来 越 “靠近 ?总 体 分 布 函数 F(z), 对 此 不 加 证 明 地 给 出 如 下 定理 。 - 

定理 4.1. 1( 格 里 汶 科 定 理 ) IEA KRE n it zi ,zs，,… ,xz, ERE 
DETRAN F(z) 的 一 个 样本 观测 值 ,Ff, (zx) 为 其 经 验 分 布 函 数 ,又 记 
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D,= sup_|F.(z)—F(z) | (4.1.3) 
则 有 
PUimD,=0)=1 
这 一 定理 中 的 D, 可 衡量 F(x) 与 F(z) 在 zx 的 一 切 值 上 的 最 大 差异 。 定 
理 表 明 足够 大 后 ,对 一 切 x ,F(x) 与 F(x) 之 差 的 绝对 值 都 很 小 这 一 事件 发 
生 的 概率 接近 于 1。 


4.1.4 正 态 概率 纸 

概率 纸 是 一 种 特殊 刻度 的 坐标 纸 ,将 样本 观测 值 画 到 概率 纸 上 可 帮助 我 
们 下 观 地 判断 总 体 是 否 属 于 某 种 分 布 .概率 纸 有 很 多 种 ,最 常用 的 是 正 态 概率 
纸 , 下 面 来 介绍 正 态 概率 纸 的 构造 及 其 用 法 ， 

4.1.41 正 态 概率 纸 的 构造 

我 们 知道 , 当 X 一 NGC) 时 ,其 分 布 函数 严 (z) 可 用 标准 正 态 分 布 函数 
B(。) 表 示 , 即 


F(z)=g| 4] (4.1.4) 


ERARE, FI RAR PEZ ALA BRO 2.3.6), 59h, EFEC ) 
EPR) MARAA. HU 1. OZXAFE ERA TEMR 


pur) =E (4.1.5) 


IA PAE O DERR PRE ARALAR MXN (3,20, E 
EA (a O !) 坐 标 系 中 是 如 下 一 条 上 升 直 线 ， 
pr) ES 

反之 ,在 (zx,B  ) 坐 标 系 中 的 任 一 条 上 升 直线 ,也 可 确定 一 个 正 态 分 布 函数 。 
SFM EDO ) 坐 标 系 中 有 一 条 上 升 直 线 @ -一 2z 一 4。 它 可 以 改写 为 DP = 
(ZX 一 2)/0.5, 这 条 直线 对 应 的 正 态 分 布 是 N (2,0. 52) 。 | 

上 述 性 质 可 帮助 我 们 识别 正 态 分 布 。 例如 XD 之 Zw 之 之 Tw 是 来 目 X 
的 容量 为 n 样本 的 次 序 观察 值 , 则 概率 已 一己 CX 委 xzo) 可 设法 佑 计 出 来 ,实际 
中 常用 的 估计 是 

k=- (4.1.6) 
石 对 每 个 F 再 计算 0 :一 UFOGEREE SINO 记分 位 数 ), 若 在 
EXE SE IS n D 
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Cras), i=1,2, sn 
假如 这 个 点 近似 在 一 上 升 直线 附近 ,我 们 可 以 很 有 把 握 地 说 ,这 个 样本 是 来 
目 茶 个 正 态 总 体 。 假 如 这 个 点 明显 不 在 一 条 上 升 直线 附近 , 那 我 们 可 以 很 有 
把 握 地 说 ,这 样本 不 是 来 自 正 态 总 体 。 
为 了 减少 计算 ,我 们 对 坐标 系 (z, 理 -1) 作 一 改进 ,只 在 纵 坐 标 上 以 D= 
$B (FF) 作 刻度 ,而 标 以 相应 的 FR( 见 图 4. 1. 10)。 这 在 作出 新 坐标 系 时 增加 些 
困难 ,但 可 使 使 用 者 省 去 了 计算 B71CF) 的 麻烦 。 具 体 做 法 如 下 ， 


41.10 正 访 概率 纸 的 构造 


在 C(F)=0 处 , 标 以 f=@(0)==0.50 
在 (FF) 二 1 处 , 标 以 F=9(1)=0. 8413 
在 多 (F)=2 处, 标 以 F==@B(2)=0.9772 
Æ Ø (F)=—1 处 , 标 以 Ff=@B( 一 1)= 二 0.1587 
在 (FF) 二 一 2 处 , 标 以 F=@B( 一 2) 二 0. 0228 
这 样 得 到 的 坐标 纸 便 是 正 态 概率 纸 。 其 横 坐标 是 等 间隔 的 , 纵 坐标 是 不 等 间隔 
的 。 还 有 一 点 要 指出 ,由 于 lim) =1, lim BCu) 一 0, 故 在 纵 轴 上 无 法 标 出 0 
与 1, 通 常 只 标 出 0. 01% 到 99. 99%， 
4. 1.4.2 利用 正 态 概率 纸 判断 总 体 是 否 为 正 态 分 布 的 步 怠 
根据 正 态 概率 纸 的 构造 可 知 ,用 正 态 概率 纸 判断 总 体 是 否 服从 正 态 分 布 
的 步 又 如 下 ，; l 
(1) 将 样本 观测 值 排序 TXT ELLA 3 
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- nN oT ri pe ee A A er Wg A A er A A A r a- rn -a 


(2) 将 点 | zw ,二 了 | i 二 1,2,… wn 点 在 正 态 概率 纸 上 ， 

(3) 目 测 这 个 点 的 位 置 ,如 果 这 个 点 在 一 直线 附近 ,尤其 是 纵 坐 标 在 
20~80% 间 的 点 离 某 直线 很 近 时 ,可 以 认为 总 体 服从 正 态 分 布 , 否 则 认为 总 体 
不 是 正 态 分 布 。 / 

例 4.1. 10 对 某 种 高 温 合 金 钢 的 9 个 试 样 在 580C 的 温度 和 15. 5 kg/ 
mm? 的 应 力 下 进行 试验 ,其 断裂 时 间 志 如 表 4.1. 3 所 列 , 这 里 已 经 进行 了 


E 9。 


99.99 


mu a gal ah 
el 


ima e a a A E HS PU a e A A mm a CNEA " LE SRT h.. 
A A Lo EF rr E FP o =y - . 3 — 
Br n ijp e o i -F == | EF n F k 1-40 < n o y ë gM e = me r m -u g 
a k -r y p r a m = i - m u P AAA AAA AE Y Ma M 
a] J- 
+ 


. o. =. a Laa 

0 1 = : ! 
Æ “Pe - k ino- n 到 = r rua -= 里 
A Aaen ari pi aein 


-+m - 
r + - A 

— pr " r= -y ra 
as 


0.01 
1.8 2.0 2.2 24 26 2.8 3.0 3.2 3.4 (180 
图 4.1. 11 ERMEK 


将 | ze H] 12=1,2,*,9 点 在 正 态 概率 纸 上 ( 用 “X ”表示 ), 这 九 个 点 


明显 不 在 一 直线 上 ( 见 图 4.1. 11), 因 而 认为 断裂 时 间 这 一 总 体 不 是 正 态 分 


194 


如 果 对 志 取 常用 对 数 ( 其 值 已 列 在 表 4. 1. 3 中 ), 横 坐标 再 重新 设 定 , 将 

[lgro ,二 1,2,…，9 再 点 在 正 态 概率 纸 上 (用 。" 表 示 ) ,这 九 个 点 近似 

在 一 直线 上 ( 见 图 4.1. 11) 。 因 而 我 们 可 以 认为 断裂 时 间 的 对 数 服从 正 态 分 布 。 
表 4.1.3 E Be E 


ta E lt 
(i) n+] glo 


398. 00 | 2. 5999 
- 480. 00 2. 6812 
989. 58 2. 7705 
712.16 2. 8526 
955. 50 2. 9802 
1233.16 3. 0910 
1 734. 00 3. 2390 
2 122. 16 3. 3268 
2 487.50 3. 3958 


4.1.4.3 利用 正 态 概率 纸 估 计 正 态 总 体 的 参数 yj 和 vc 

正 态 概率 纸 除 了 可 以 对 总 体 分 布 是 否 为 正 态 作 直观 判断 外 ,还 可 以 对 正 
仿 总 体 的 参数 jy 与 o 的 值 作 出 “估计 ”。 当 ”个 点 近似 在 一 直线 附近 时 ,我们 可 
以 用 目测 方法 画 出 该 直线 LE 4. 1. 11)。 由 于 在 总 体 久 ~ 和 N (ja) 时 ,有 

?| 于 外 = 全 ， 一 人 
0.8413 ， 六 一 /十 0 
BA FRIA O. 55 0.8413 处 分 别 画 两 条 水 平 线 , 交 直线 ! 于 A.B 两 
点 ,再 从 4A.B 两 点 分 别 画 垂 线 交 横 轴 于 M,N 两 点 , 则 M 的 横 坐 标 值 可 以 看 
成 是 u 的 一 个 估计 值 ,N 的 横 坐 标 值 可 以 看 成 是 o 的 一 个 估计 值 ,从 而 将 
N 5 M 的 横 坐 标 之 差 作 为 的 估计 值 , 这 一 过 程 如 图 4. 1. 12 所 示 。 

在 例 4. 1. 10 中 ,从 图 4. 1. 11 可 以 认为 lgt 服从 正 态 分 布 , 且 的 估计 值 
( 记 为 MA 3.00,0 的 估计 值 ( 记 为 6) 为 0.30。 这 样 一 来 ,我 们 对 这 种 高 温 合 
金 钢 的 断裂 时 间 有 了 一 个 初步 的 看 法 :此 种 高 温 合金 钢 在 580C 和 15. 5kg/ 
mm” 应 力 下 的 断裂 时 间 近 似 服从 对 数 正 态 分 布 LNC. 00,0. 302) 。 

这 里 从 图 上 获得 的 关于 与 o 的 信息 当然 是 比较 粗粮 的 , 且 会 因 人 而 异 ， 
但 由 于 此 方法 简单 ,能 快速 给 人 一 个 初步 印象 ,因而 人 们 乐于 使 用 。 关 于 “与 
o 的 信 计 属于 参数 估计 问题 ,将 在 下 一 章 详 细 讨 论 ，。 

当 样 本 量 较 大 时 ,可 用 分 组 方法 先 给 出 分 组 的 频数 分 布 表 ,并 求 出 各 组 的 
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0.8413 
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A (Fo 


图 4.1.12 估计 ww 与 cz 的 示意 图 
累计 频数 。 设 样本 容量 为 n, 分 为 个 组 ,第 i 组 区 间 为 (a;-1,a;j], 记 这 组 的 频 
数 为 mi 那么 到 该 组 为 止 , 前 z 组 的 累计 频数 N: = n n + … + nis Y 


D) ,z=1,2,… 必 点 在 正 态 概率 纸 上 以 判断 该 样本 是 否 来 自 正 态 分 


布 。 当 认为 是 正 态 分 布 时 ,可 如 上 那样 对 分 布 的 参数 e 与 c 作出 估计 ， 

例 4.1.11 为 了 解 某 种 货物 的 价格 -- 年 内 在 各 地 的 变化 ,随机 选取 了 60 
个 地 点 ,调查 各 地 年 初 值 100 元 的 该 种 货物 到 年 底 时 的 所 值 , 分 组 统计 如 下 
表 4.1.4, 试 用 正 态 概率 纸 判 断 其 是 否 为 正 态 分 布 。 


di» 


表 4.1.4 年 底价 值 
分 组 (单位 ;元 ) SR n: N; 00 
(80,85] 1 1 1.6 
(85,90] 4 5 8. 2 
(90,95] | 3 8 13. 1 
(95,100] 6 14 23. 0 
(100,105] 7 21 34. 4 
(105,110] 10 31 50. 8 
(110,115) 14 45 73.8 
(115,120] 7 52 85. 2 
(120,125] 4 56 91.8 
(125,130) | 2 58 95. 1 
(130,135] 1 59 96. 7 
(135,140] | 1 60 98. 4 
合计 7 一 60 
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图 4.1.13 ” 正 态 概率 纸 
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为 在 正 态 概率 纸 上 描 点 ,将 各 组 的 累计 频数 N, R- 均 列 在 表 41.4 


中 ， 现 将 (85,1.6%), (90,8.2%),…,(140,98.4%) 点 在 正 态 概率 纸 上 ( 见 
图 4.1. 13) 。 由 图 上 可 见 ,这 些 点 基本 在 一 直线 附近 。 用 目测 方法 在 图 上 男 出 
直线 1, 可 得 的 估计 值 为 108.5,w 十 ac 的 估计 值 为 120.5, 从 而 ce 的 佑 计 为 
12。 因 此 可 认为 该 种 货物 年 底价 值 服从 正 态 分 布 N (108. 5,12 )。 


$ 4.2 统计 量 与 抽样 分 布 


4. 2.1 统计 量 及 其 分 布 

样本 来 自 总 体 ,样本 的 观察 值 就 含有 总 体 各 方面 的 信息 ,但 这 些 信 息 较 为 
分 散 , 为 使 这 些 分 散在 样本 中 有 关 总 体 的 信息 集中 起 来 反映 总 体 的 各 种 特征 ， 
需要 对 样本 进行 加 工 , 一 种 有 效 的 方法 是 构造 样本 的 函数 ,不 同 的 样本 函数 反 
映 总 体 的 不 同 特 征 。 这 种 样本 的 函数 便 是 统计 量 ， 

定义 4.2.1 EX=(AX 0 X 2 …X) 是 取 目 某 总 体 的 一 个 容量 为 二 的 样 
本 ,假如 样本 函数 

T=T(X3)=T(X ¡,X2,* Xp) 

中 不 含 任何 未 知 参数 , 则 称 工 为 统计 量 。 统 计量 的 分 布 称 为 抽样 分 布 。 

上 述 定义 中 规定 “不 含 任何 未 知 参 数 ” 是 强调 在 获得 了 样本 的 观察 值 x== 
(ziyzz…wy2a) 后 ,代入 统计 量 立 即 可 以 算得 统计 量 的 观察 值 

t=T) =T (ar ln) 

例 4.2.1 RERAXRAES2% N) AH A 与 于 为 未 知 参 数 ， 

从 该 总 体 获得 的 一 个 样本 为 (1 ,处 2，,… Xa) M 


便 是 一 个 统计 量 ,但 是 
Xp 全 一 
都 不 是 统计 量 , 因 为 它们 含有 未 知 参数 ， 
由 正 态 分 布 的 性 质 可 知 叉 的 分 布 为 NCp, 号 ), 这 就 是 统计 量 有 的 抽样 


分 布 。 
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今后 我 们 将 看 到 统计 推断 的 好 坏 与 所 选择 的 统计 量 的 分 布 有 密切 的 天 
系 , 因 此 寻求 抽样 分 布 是 统计 学 的 一 项 重要 内 容 , 本 市 将 讨论 一 些 第 用 统计 量 
及 其 分 布 , 下 一 节 还 将 讨论 一 类 与 次 序 统计 量 有 关 的 常用 统计 量 ,并 介绍 用 随 
机 模拟 方法 寻求 近似 抽样 分 布 的 方法 。 


4.2.2 样本 均值 及 其 分 布 
定义 4.2.2 X,X,X, 是 取 自 某 总 体 的 一 个 样本 , 它 的 算术 平均 
数 


> 1 ~ 
X=- 2X (4.2.1) 


称 为 样本 均值 。 当 获得 了 样本 观察 值 (z ,zx;，,… ,zx,) 后 代入 上 式 , 可 求 得 样本 
均值 的 观察 值 , 亦 简称 样本 均值 : 


大 家 知道 ， 样本 中 的 数据 有 大 有 小 ， 而 样本 均值 z 总 处 于 样本 的 中 间 位 
置 , 小 于 式 的 数据 的 偏差 xz; 一 二 是 负 的 ,大 于 三 的 数据 的 偏差 rT REN, 
此 种 偏差 之 和 人 恒 为 零 ,这 是 因为 


am - Sja —nz=0 (4. 2. 2) 


而 总 体 分 布 的 数学 期 望 FE(X) 也 是 位 于 取 值 范围 的 中 心 位 置 , H ELX 
E(X)]=0, 因 此 只 要 样本 是 简单 随机 样本 ,那么 样本 均值 是 反映 总 体 分 布 数 
学 期 望 所 在 位 置信 息 的 一 个 统计 量 , 如 果 总 体 数 学 期 望 是 /那么 样本 均值 区 
将 是 jy 的 一 个 很 好 的 估计 量 。 

例 4. 2. 2 某 厂 实行 计件 工资 制 ,为 及 时 了 解 情况 ,随机 抽取 30 名 工人 ， 
调查 各 自在 一 周 内 加 工 的 零件 数 , 然 后 按 规定 算出 每 名 工人 的 周 工资 如 下 ， 
(单位 :元 ) 

156 134 160 141 159 141 161 157 171 155 

149 144 169 138 168 147 153 156 125 156 

135 156 151 155 146 155 157 198 161 151 
这 便 是 一 个 容量 为 30 的 样本 观察 值 ,其 样本 均值 为 ， 


到 一 30(156 十 134 十 … 十 161 十 151) 一 153.5 


它 反 映 了 该 三 工人 周 工资 的 一 般 水 平 。 | 
Bl 4. 2. 3( 分 组 样本 均值 的 近似 计算 ) 如 果 在 例 4. 2. 2 中 收集 得 到 的 样 
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本 观察 值 用 分 组 样本 形式 给 出 ( 见 表 4. 2. 1) ,此 时 样本 均值 可 用 下 面 方法 近 
似 计算 ;以 r 表示 第 i 个 组 的 组 中 值 ( 即 区 间 的 中 点 ),n; 为 第 i 组 的 频数 ,i 一 


k 
1,2," "3%, Sn; — n, DU 
i=] 
1 k 
I DTT: (4. Ze 3) 


表 42.1 某 厂 30 名 工人 周平 均 工资 额 


周 工 资 额 区 间 TAX ni 组 中 值 zx; niTi 
(120,130] 1 125 125 
(130,140] 3 135 405 
(140,150] 6 145 | 870 
(150,160] 14 155 2170 
(160,170] | 4 165 660 
(170,1807 1 175 175 
(180,190) 0 185 0 
(190,200] 1 195 195 

合计 30 4 600 
则 本 例 中 
-__4600 _ 
T 30 =153.33 


这 与 例 4.2.2 的 完全 样本 结果 差不多 。 

在 样本 容量 较 大 时 ,给 出 分 组 样本 是 常用 的 一 种 方法 ,虽然 会 损失 一 些 信 
乱 ,但 对 总 体 数学 期 望 给 出 的 信息 还 是 十 分 接近 的 。 

(4. 2. 3) 式 的 另 一 种 表示 方法 为 


称 为 加 权 平 均 ,xz 的 权 为 于 ,一 1， 2 sk. 


Bl 4.2.4 一 果 钻 石 的 重量 y 是 未 知 的 ， 度量 它 的 单位 常用 克拉 
(Carat) ,1 克拉 等 于 200 Æ, B 0. 2 克 。 由 于 钻石 极为 稀少 ,硬度 极 高 ,又 可 
作 狐 饰品 , 故 其 价格 昂贵 .在 精密 天 平 上 秤 其 重量 ,每 次 都 会 不 同 , 若 重复 5 次 
秤 其 重量 就 得 到 5 PAE: 

2.15， 2.14, 2.17, 2.14, 2.15 
这 是 一 个 容量 为 5 的 样本 ,人 们 常用 样本 均值 
元 一 (2.15 十 2. 14 十 2. 17 十 2. 14 十 2.15)/5 一 2. 15 
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作为 该 颗 钻石 真实 重量 u 的 估计 值 。 知 人 们 问 :这 霜 销 石 的 重量 确 为 2. 15 克 
拉 吗 ? 为 此 我 们 还 需 作 进一步 研究 。 

首先 要 回答 的 是 ,这 个 样本 来 自 哪 一 个 总 体 , 行 把 销 石 在 精密 天 平 上 秤 出 
的 重量 记 为 天 , 它 与 A HAX- ume 就 是 秤 量 误 差 , 它 是 由 精度 天 平 与 测量 
员 引 起 的 , 它 可 大 可 小 ,可 正 可 负 , 呈 随机 状 ,所 以 误差 6 是 随机 变量 ,许多 实 
际 经 验 表 明 , 秤 量 误差 6。 服 从 期 望 为 0. 方差 为 o2 的 正 态 分 布 , 即 e~N (0， 
0?) ,从 而 秤 量 值 了 XX 二 py 十 e~N Cy,a?), 上 述 容 量 为 5 的 样本 就 是 来 自 这 个 正 态 
分 布 的 一 个 样本 。 

我 们 现在 是 用 样本 均值 对 jy 作 估计 的 ,如 今 要 评价 这 一 估计 的 好 坏 当 
REX 的 分 布 。 由 正 态 分 布 性 质 知 样本 均值 X 的 分 布 为 

X~N| E] (4. 2. 4) 
BERTA, X 与 的 绝对 偏差 | 驻 一 pz| 不 超过 1.96 倍 标准 差 的 概率 为 0. 95， 
即 
P(|X—p|<1l. 960/4V n )=0. 95 
或 者 讲 
P(X—1. 960/4n <¿<X +1. 960/4/ n )=0. 95 
MS n=5,7=2. 15, 若 秤 量 的 标准 差 vc= 0. 01( 克 拉 ) BARATA: 
P(2.1412<1<2. 1588)=0. 95 

从 而 可 以 有 95% 的 把 握 说 这 颗 钻 石 的 真实 重量 介 于 2.1412 克拉 与 2.1588 
克拉 之 同 。 这 便 是 我 们 所 给 出 的 统计 结论 。 

上 面 这 一 例子 告诉 我 们 ,获得 统计 量 的 分 布 对 评价 统计 量 的 好 坏 是 至 关 
HEM. 

EHE X X X, 来 自 正 态 分 布 N (1,o) 场 合 , 其 样本 均值 及 的 分 布 


为 Wu, 乞 )。 现 在 我 们 来 讨论 当 样本 XoXo X, 来 自 非 正 态 总 体 时 ,其 样 


本 均值 蕊 的 分 布 。 

定理 4.2.1 设 X, 义 ;,…,X, 是 从 菜 总 体 随机 抽取 的 一 个 样本 ,该 总 体 
的 分 布 未 知 (可 能 是 离散 的 ,也 可 能 是 连续 的 ,可 能 是 均匀 分 布 ,也 可 能 是 偏 态 
分 布 等 ), 但 知 其 均值 为 ,方差 为 a:( 有 限 且 不 为 0), 则 当 样 本 量 n 充分 大 时 ， 


翌 本 均值 也 近似 服从 正 态 分 布 ,其 均值 仍 为 x, 方差 为 全 , 记 为 
XN| E | (4.2.5) 
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证 :由 中 心 极限 定理 (定理 3. 5. 1%: 
AX NOD 
由 此 可 知 
Xi+X +" +X, N(nuyno) 
XN 


这 一 定理 表明 ,无 论 总 体 分 布 是 什么 ,只 要 样本 容量 n 充分 大 (譬如 大 于 
30), 则 样本 均值 X 上 总 可 近似 看 作 正 态 分 布 ,图 4. 2. 1 示意 了 这 一 近似 过 程 。 


总 体 [ 总 体 II 总 体 III 


图 4. 2.1 样本 均值 的 分 布 
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BE PER Xi Xost Xn 来 自 指数 分 布 Exp A) ,)>>0, 则 总 体 期 望 为 丈 ， 
FEI MWAK n FEA REA EN D 

又 譬如 ,样本 XX 2 0 Xa KE LA, p) 0<p<1 MAREN 户 ,方差 
为 p(1 一 ,那么 当 FAA ERE XAN] p PIP], 


4.2.3 样本 方差 与 样本 标准 美 
定义 4.2.3 设 和 XXX, 是 取 自 某 一 总 体 的 样本 , 它 关 于 样本 均值 


X 的 平均 偏差 平方 和 
Si 二 二 NX, — Xy (4.2.6) 
称 为 样本 方差 ,其 算术 根 5S, 一 VS: 称 为 样本 标准 差 ， 
在 到 不 大 时 ,常用 
5?— 一 Da- Xy (4.2.7) 


作为 样本 方差 (也 称 无 偏方 差 ,其 含义 在 下 一 章 叙 述 )， 其 算术 根 5 一 VERA 
”样本 标准 差 。 
当 把 观察 值 代入 后 可 得 样本 方差 与 样本 标准 差 的 观察 值 . 


一 一 2, s =N s 
或 


1 x _ 
s= > (x; T, s=w $ 
n=1 E 


在 实际 应 用 中 也 简称 它们 为 样本 方差 和 样本 标准 差 。 
在 本 书后 面 几 章 中 我 们 主要 用 的 是 S 与 8 ,但 在 涉及 到 具体 数值 计算 时 
一 般 用 小 写 的 5 与 s。 


当 总 体 方差 较 大 时 ,样本 的 观察 值 就 较为 分 散 , 从 而 使 偏差 平方 和 3 (2 


一 万 ” 较 大 ,那么 :与 ;也 较 大 ,反之 也 如 此 。 因 此 ,样本 方差 与 样本 标准 差 反 
映 『 了 数据 取 值 分 散 与 集中 的 程度 , 即 反映 了 总 体 方 差 与 标准 差 的 信息 ,下面 一 
个 例子 给 出 了 直观 的 说 明 。 
例 4.2.5 设 我 们 获得 了 如 下 三 个 样本 : 
样本 A:3,4,5,6,7 
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样本 B:1,3,5,7,9 

样本 C:1,5,9 
如 果 将 它们 画 在 数 轴 上 (图 4. 2.2) ,明显 可 见 它们 的 “分 散 ” 程 度 是 不 同 的 : 样 
本 4 在 这 三 个 样本 中 比较 密集 ,而 样本 C 比较 分 散 。 


样本 4 
3 4 5 6 7 
3 5 7 HA 有 
FA C 
1 5 


图 4.2.2 三 个 样本 的 观察 值 


这 一 直觉 可 以 用 样本 方差 来 表示 。 这 三 个 样本 的 均值 都 是 5, 即 元 一 za 一 
Tc=5 ERRE n4 二 5,n8 二 5ync 二 3, 从 而 它们 的 样本 方差 分 别 为 : 


5 二 LG 5)2 十 (4 一 5)2? 十 (5 一 5)2 十 (6 一 5)2 十 (7 一 5)]= =2. 5 


area IT (55H (7—5) + (9— 1 =10 


s= [a 5)2 十 (5 一 5)2 十 (9 一 51216 


由 此 可 见 s¿>só> 4, AAMER, CMA T BUE AT RRE. E 
于 样本 方差 的 量 岗 与 样品 的 量 纲 不 一 致 ,故常 用 样本 标准 差 表 示 分 散 程度 ,这 
HA sa=1.58,58=3. 16,504 ,H FEA seo>ss>sas 

由 于 样本 方差 (或 样本 标准 差 ) 很 好 地 反映 了 总 体 方差 (或 标准 差 ) 的 信 
恕 ,因此 车 当 总 体 方差 P 未 知 时 ,常用 S* 去 估计 ,而 总 体 标准 差 o 常用 样本 
标准 差 S 去 估计 。 


不 管 是 计算 s: 还 是 计算 s:, 首 先 应 该 计算 偏差 平方 和 QQ 一 之 ， (zi 一 元 )2， 
下 面 是 计算 Q 的 一 个 常用 的 公式 ， 


Q = > (r:— T) = Yada “ 工 十 Dz 
一 之 4 xi nz (4. 2. 8) 


= Lat (2 (4.2.9) 


例 4.2.6 计算 例 4. 2. 2 中 的 样本 方差 与 样本 标准 差 。 
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解 :在 例 4, 2. 2 中 已 求 得 z= 153.5 4H (4.2.8 Q.H F 


>)z? 一 1562 十 1342 十 … 十 1512 一 712155 
i=] 


代入 (4. 2. 8) 
Q=712155— 30 X 153. 52 一 5287. 5 
所 以 样本 方差 为 
2 1 — 
s = z5 7 X 5287. 5=182. 3278 
样本 标准 差 为 


s 一 人 /182. 3278 一 13. 50 
对 给 出 分 组 样本 的 场合 ,也 可 求 样 本 方差 与 样本 标准 差 的 近似 值 ,此 时 偏差 平 
AMAM PEWA 


l 
Q 之 D nir — nr) (4. 2.10) 


“y mit 一 nx (4. 2.11) 
这 里 符号 同 前 ,而 去 是 用 (4. 2. 3) 近 似 得 出 的 。 
例 4.2.7 计算 例 4. 2.3 中 给 出 的 分 组 样本 的 方差 与 标准 差 。 


解 ;在 例 4. 2. 3 中 已 求 得 和 /niz; 一 4600,n 一 30， 由 于 


k 
nizi =1X 1252 十 3X1352 十 十 1X1952 一 710350 
代入 (4. 2. 10) 后 有 


2 . 
Q=~710350— #0 — 5016. 6667 


30 
从 而 样本 方差 为 
> 5016. 6667 
> 30 


一 1 
样本 标准 差 为 


s=V/172.9985=13. 15 
结果 与 例 4. 2. 6 相差 不 大 。 
0428 从 某 一 总 体 获 得 了 个 样本 ,第 i 个 样本 的 样本 容量 为 nm, 样 


= 172. 9985 


本 均值 为 去, 样本 方差 为 号, 记 n= 人 mi 将 这 下 个 样本 合并 成 一 个 容量 为 y 
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的 样本 , 求 此 样本 的 均值 与 方差。 
解 : 记 第 2 个 样本 的 观察 值 为 Kits Xi29""", ? , 则 已 知 的 是 


=> rj s De zy 


则 


这 里 用 到 了 Se, (ay 一 去) = 0 这 一 性 质 。 


下 面 我 们 将 研究 样本 方差 的 抽样 分 布 。 由 于 一 般 情况 下 样本 方差 的 抽样 分 
布 不 易 精确 得 出 ,而 当 总 体 为 NCy,0 ) 时 样本 方差 的 抽样 分 布 可 以 精确 求 出 。 
定理 4.2.2 设 Xy D CU >» n 是 来 H 正 态 总 体 N(p,a?) 的 一 个 样本 , 则 
] ~ 可 2 nn _ Do Ya — Y 
72% == (an — 1), H5 XA. 


g? 


证 :考虑 对 样本 A=(AX, P. CTS XD 作 线性 变换 , 令 


== 7 Xs 

27 (X14Xo) XK 

2= 7, +HX XxX )— AA 

A (X, +X + +X o ES 4 
Vn— Dn ~ (n—1)n 

Z=- =X Xt += n X 


A ei eg ET mm e 


由 于 和 1 从， 人， 独立 同 分 布 , 坷 服从 NCp,0%) > 则 可 以 证 明 


Z = X ~N (0,0) 
-万 一 
] 2 
Z, = —=—— (X, +X )—— =X ~N 0,0) 
VxX3 — © VXx3 


1 n—] 
Za RR A HX t e t Xd RX 2 N (0,0) 
AMADO © VD) 


Z, = (Xt Xt N (Y n puro?) 


且 通 过 计算 可 知 ， 
Cov(ZiL;)=0 , 1%] 
1X Ye HB Lisls" s Ln 相互 独立 。 
由 于 
1 > 2 
2 D X — — X) = ¿LIX nz] 


n—] 


ji 
= 7 dz 一 Z2) Y 


i=] 


Li | * 


O 


H Lir£os" Zi 1 相互 独 芯 , 且 均 服从 NO ,0° )， Amas 一 了 7 ,1 仍 相互 独 
HRA (0,1)。 由 第 三 章 例 3. 2. 8 知 


i 之 。 (X:—X) 一 这 (2 一 ]) 


又 由 Zi Zi o Zar Zn 相互 独立 ,及 广 ED x Xy 2 
AX? 与 入 独立 。 
"42.4 FAME BA 
EX 4.2.4 RX oX X, 是 来 自 某 总 体 的 一 个 样本 , 则 称 
A => IX 3 k=1,2,*» (4. 2. 12) 


IES 
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B; — 一 (X; — Xy k = l,2,..* (4. 2. 13) 


为 样本 的 大 阶 中 心 距 
它们 分 别 有 反映 了 忆 体 & 阶 原点 害 M Sk BYTE v HAD. FRA A = 
X,B,=0,B,=8S?, 
定义 4.2.5 XiXe X, 是 来 目 某 总 体 的 一 个 样本 , 则 称 
SK = B;/ B3” (4.2.14) 
为 样本 偏 度 。 
SK EMT AJA EA RADA RE. 4 SK>0 时 ,分 布 的 形状 
是 右 尾 长 , 称 为 正 偏 的 ; 当 SK<O 时 ,分 布 的 形状 是 左 尾 长 , 称 为 负 偏 的 。 
定义 4.2.6 Xi X2, X, 是 来 自 某 总 体 的 一 个 样本 , 则 称 
KU=B,/B3—3 (4. 2.15) 
为 样本 峰 度 。 
KU 反映 了 总 体 分 布 密 度 曲 线 在 其 峰值 附近 的 陡峭 程度 的 信息 。 当 KU 
>0 时 ， 分 布 密度 曲线 在 其 蜂 附 近 比 正 态 分 布 来 得 陡 ， 当 KU<O 时 ， 比 正 态 分 
布 来 得 平坦 。 
例 4.2.9 求 例 4. 2. 2 中 样本 的 偏 度 与 峰 度 。 
解 :由 于 
SK=Bs/BY?, KU=B,/Bi— 
为 此 需 先 求 出 B;,B;, Bi, 而 它们 可 利用 下 列 展开 式 来 求 ， 


Bl Dal A 
-15 (ir) = 23 . 二 “无 十 2 元 
7n i=] mM i=l m i=l 


= Á; — 3AT + 2T? 
53A -a-la 一 4。 -D r? a. = Dai e PE 


= Á, — 4AT +H 6A T — 3T’ 
MICRA RA 7 42,43) Ar FEB 4. 2. 2 与 例 4. 2.5 中 已 算得 ， 


1=153.5, > <x? = 712155 
r=] 


从 数据 还 可 算得 
208 


> z? = 110994549 
i=l 


Y) al = 17442142657 


r=] 


ni A: =23738.5,» „= 3699818. 3, A,=581404755. 3 
由 此 得 已 ,一 176.25， B,=1849.80, B,=172273. 88 
从 而 求 得 


SK=0.79 ， KU=2.55 
该 组 样本 稍 呈正 偏 , 右 尾 较 长 ,在 峰 处 较 陡 。 
偏 度 与 峰 度 的 抽 祥 分 布 难于 精确 求 出 ,其 近似 分 布 可 用 随机 模拟 方法 获 
得 ,这 将 在 下 一 节 介 绍 。 


$43 次 邦 统 计量 及 其 分 布 


次 序 统计 量 是 为 一 类 常用 的 统计 量 ,由 它 还 可 派生 出 一 些 有 用 的 统计 车 。 


4.3.1 次 序 统计 量 的 概念 

定义 4.3.1 Ù Xi Xz Xn, ERA DIE X KTERE, Xo AA 
样本 的 第 i 个 次 序 统 计量 , 它 是 样本 又 , 义 ,,…,X, 的 满足 如 下 条 件 的 函数 : 
每 当 样本 得 到 一 组 观测 值 xz1,zz,… ,zx 时 ,将 它们 从 小 到 大 排列 为 

XDETDE ET 

B i ME zw 便 是 XG 的 观测 值 , 称 XX ,Xe ，…Xow 为 该 样本 的 次 序 统计 量 ， 
X 又 称 为 该 样本 的 最 小 次 序 统计 量 ,Xw 又 称 为 该 样本 的 最 大 次 序 统 计量 。 

下 面 的 例子 可 以 帮助 我 们 理解 次 序 统计 量 的 含义 。 

例 4.3.1 放 安 中 有 三 种 球 , 球 上 编号 为 0,1,2。 它 们 的 外 形 、 重 量 .个 数 
部 相同 。 者 规定 从 袋 中 摸 到 编号 为 ; 的 球 得 ;分 ,那么 这 一 得 分 总 体 可 以 用 如 
FIRE: 


X 0 1 2 


Fiir 


P 1/3 1/3 1/3 


这 里 X 表示 一 次 摸 球 得 到 的 分 数 。 如 今 进 行 返回 抽样 , 连 抽 三 次 ,获得 一 个 容 
量 为 3 的 样本 XXXs REHA X 都 与 总 体 X 具有 相同 的 分 布 , 且 相 互 
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独立 。 这 种 样本 的 一 切 可 能 取 值 有 3 王 27 种 ,将 它们 列 在 表 4. 3. 1 的 左 侧 ,而 
它们 的 相应 的 次 序 统计 量 的 取 值 列 在 表 4. 3. 1 WAM, 
表 4.3.1 FR. XA XIOMARA X o XX o ,XX 的 取 值 


Xa X (2) 
0 0 


> 
ES 
ES 


DN DR Dyk e. NNDO DN e. OO- pO Doo 5320 O O 
PM = td NN e bDdOo.0DNDRDO O by (Of O Do PP? OO 
MN = ADD PII PD O DNDOO.DIDGO meme OOo Onm O 
N HA A AA?AO0OOOoOo oO o oO O OOOO OOOO Oo 
D =e DND e = āe pbD)bDBR A RS e me 2 e å- 5O O OO O Oo 


由 表 4. 3. 1 可 见 : 次 序 统计 量 (Xa) ;六 (02), 外 0)) 与 样本 (XI DE X ) 完 全 不 
相同 ,具体 表现 在 以 下 几 个 方面 ， / 


Deo ,Xe ,六 (的 分 布 是 不 同 的 。 
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(2) 任 意 两 个 次 序 统计 量 的 联合 分 布 也 是 不 同 的 。 


X 
0 0 0 
1 
1 27 0 
6 ] 
< 27 27 


《3) 任 意 两 个 次 序 统计 量 是 不 独立 的 ,例如 : 


9 ,19 13 
PX w= oS DSA Te Aosa] 


4.3.2 ”次序 统计 量 的 抽样 分 布 | 
只 要 总 体 的 分 布 已 知 ,那么 右 干 个 次 序 统计 量 的 联合 分 布 都 是 可 以 求 出 
的 。 下面 仅 就 总 体 X 的 分 布 为 连续 的 情况 进行 讨论 。 现 设 总 体 X 的 分 布 函数 “ 
为 F(z) ,概率 密度 函数 为 p(x), 人 队 中 获得 样本 Xi1 ,XX2，… Xm0 
(1) 第 下 个 次 序 统计 量 Xo 的 概率 密度 函数 为 : 
ni 


AZ) 一 ET a AL 一 下 (z) plr) (4.3.1) 


证 :考虑 第 个 次 序 统计 量 Xw 落 在 无 穷 小 区 间 (z,z 十 Az] 内 这 一 事件 ， 
它 等 介 于 “容量 为 ”的 样本 中 有 有 一 1 个 分 量 小 于 或 等 于 zx,1 个 分 量 落 在 (z， 
7 十 Az | 内 ,余下 的 n 一 个 分 量 均 大 于 x 十 Ax”, 其 示意 图 见 图 4.3.1, 


-1 个 分 量 、、、 /nk 个 分 量 


xX XX 十 AX 
图 4. 3. 1 样本 分 量 的 分 布 
每 一 样本 的 分 量 小 于 或 等 于 z 的 概率 为 F(z), 大 于 xz 十 Az 的 概率 为 1 一 
F(z 十 AX), 落 在 (zr 十 Azj 内 的 概率 为 F(z 十 Az) 一 F(x), 而 将 个 分 量 分 成 


这 样 的 三 组 ,总 的 分 法 有 如 一 jy 下 一 ; 种 ,车 以 FCzx) 记 XXw 的 分 布 函 数 ， 
那么 XXw 落 在 (zx,z 十 Azxj 内 的 概率 为 
FA 十 AZz) 一 ECZ) 


| 


= gp FIAR Fa] FHA) 
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两 边 除 以 Az ,并 令 Ar>0, 则 有 
Fi(x+Ax)— F(x) 


Az 


Pr (x)= lim 


n] 


一 amor a p EOP OLF 
第 & 个 次 序 统计 量 的 两 个 特例 是 样本 最 大 次 序 统计 量 Xeo IMF E 
计量 XX, 由 (4.3.1) 可 给 出 它们 的 概率 锯 度 函数 。 
HABBO CTE X q) 的 概率 黎 度 图 数 , 只 要 在 (4. 3.1) APRA =n BE: 
pT) =np (rc)LF Cr) J (4. 3. 2) 
ERA 
Fa = [F (x) ] | (4.3.3) 
样本 最 小 次 序 统计 量 Xo 的 概率 密度 函数 ,只 要 在 (4. 3.1) 式 中 取 4 一 1 
印 得 : 
pılzr)=np(r)| 1— Elx) J! (4.3.4) 
ETA 
Fi(2)=1-[1-F(2) ]" (4. 3.5) 
这 些 结 果 与 8 3. 2. 3 的 结果 完全 一 样 。 
例 4.3.2 设 X,X,,…,X, 是 取 自如 下 指数 分 布 的 样本 ，; 
F(zr)=1—e *, x>0 
K P(X 这 a) 与 P(Xo, 过 5b), 其 中 ,6 为 给 定 的 正 数 。 
解 :为 求 概率 p(Xao>0 I P(X mw<b), MIER Xo 天 ww 的 分 布 。 由 
(4. 3. 5) 知 ,Xa) 的 分 布防 数 为 
F(W=1-[11-—F(0=l-e*", >0 
从 而 
P(Xy>a)=1—F,(a)=e "" 
OEI TES 
F(x)=[ F(x) =[1—e 47, >0 


PX <D=F,(M)=(1—e *)" 
B) 4.3.3 H XoXo X ARALO LIE ARA, REA 
序 统计 量 Xoo 的 期 望 。 
解 : 先 求 Xw 的 概率 密度 函数 。 由 于 总 体 和 ~ VC0,1) ,因此 总 体 的 密度 函 
数 为 
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O ， O 
ro- ， 0<i<Il 
1, x>l 
由 (4. 3. 1) 可 知 和 的 密度 函数 为 ， 


n! 


一 _ n—k 

pea) =L]; nk)” LAA, 0O<1i<l 

从 而 
me Al k — n—k 
ECXw) = | zpndda = i oda 

O TE ACE CN ED 
© (k — 1)!(n— k)! T(n + 2) 
— n! kin — k)! 
DG — k)! @ +1)! 
o k 
= n+l 


下 面 讨论 两 个 次 序 统 计量 的 联合 密度 函数 ,这 里 仅 给 出 一 个 特例 。 
(2) 耻 出 与 和 ow 的 联合 密度 函数 。 
Pyryn) =nn—1p Oy LF Cyn d) — F CyD ply,) 
MEAR (4.3.6) 
HP a 可 为 一 co 可 为 十 ce。 | 
证 :我 们 知道 Xo 和 om 的 联合 密度 函数 可 定义 为 


P (yi > Yn ) 
= ot P OKK o Syt <A Y t Ay) 
— im 

Ay, >0,4y_—0 Ay . Ayn 


aX y¡< yn Sb 
¡ESO o Sy t Ay s YLK REST A! n 个 瑟 不 相 容 事 | 
件 的 交 “X,; 落 在 区 间 Guy +dy A), X, BE Om ya tây P HR 2 一 2 个 
AE O tH Ay MIA a FAN : 
[F Cy tH AyD FGD e LEO E Oy TAY TY LF Cynt Ay) —F Cyn) 


F A — F 
由 Cz) 的 可 微 性 ,可 知 当 Ay 0 4, ATI IG -po(y), 当 Aw->0 


Ay 
F n A n — F 天 + > 
E PO y RAR HET 


pyis yn) =—=nna—1 ply) LF Cyn) —E CyD ply,) 
由 Xo 与 Xow 的 联合 密度 珊 数 ,可 求 出 称 为 “ 极 差 ?的 一 种 统计 量 的 分 布 ， 
这 将 在 下 一 小 段 讨 论 。 
下面 我 们 转 入 讨论 与 雇 序 统计 量 有 关 的 各 用 统计 量 。 


4.3.3 样本 极 差 

定义 4.3.2 样本 最 大 次 序 统 计量 与 样本 最 小 次 序 统 计量 之 差 称 为 样本 
极 差 ,简称 极 差 ,常用 R 表示 。 

如 果 样 本 容量 为 n, MAFRA 

R=Xw-Xo (4.3.7) 

在 有 些 书 上 也 称 极 差 为 全 距 , 它 表示 样本 取 值 范围 的 大 小 ,也 反映 了 总 体 取 值 
分 散 与 集中 的 程度 。 一 般 说 来 ,车 总 体 的 标准 差 o 较 大 ,从 中 取出 的 样本 的 极 
老 也 会 大 一 些 ; 者 总 体 的 标准 差 o 较 小 ,那么 从 中 取出 的 样本 的 极 差 也 会 小 一 
些 , 反 过 来 也 如 此 ,大 样本 极 差 较 大 ,表明 总 体 取 值 较 分 散 , 那 么 相应 总 体 的 标 
准 差 也 较 大 ; 石 梓 本 极 差 较 小 , 则 总 体 取 值 相对 集中 一 些 ,从 而 该 总 体 的 标准 
差 较 小 ,图 4. 3. 2 显示 了 这 一 现象 。 


= P Èk 


-一 一-| -一 
4. 3. 2 样本 (用 XX 表示 ) 极 差 反 映 总 体 分 散 程 度 


极 差 常 在 小 样本 (n 达 30) 的 场合 使 用 ,而 在 大 样本 场合 很 少 在 实际 中 使 
用 .这 是 因为 极 差 仅 使 用 了 样本 中 两 个 极端 点 的 信息 ,而 把 中 间 的 信息 都 丢弃 
了 , 当 样 本 容量 越 大 时 ,丢弃 的 信息 也 就 越 多 ,从 而 留 下 的 信息 过 人 少 , 其 使 用 价 
ERPAT. 

当 总 体 分 布 为 WCpma2) 时 ,由 (4. 3.6) 可 求 出 容量 为 时 的 样本 极 差 尺 
二 XX 一 半山 的 密度 函数 为 : 


ew = E te) E a, 
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x >o (4.3.8) 
其 中 BC。) 为 标准 正 态 分 布 的 分 布 清 数 。 此 时 R 的 数学 期 望 为 
ER,=d,o0 (4.3.9) 
其 中 


2 2 


ce co wt)! + 
d, = | “| [ec + uv) 一 更 (oo) | e 2?  dudu 
是 一 个 仅 与 n 有 关 的 第 数 , 通 过 数值 积分 可 求 得 在 不 同 % 下 的 值 ( 见 
表 4. 3. 2)， 
表 4.3.2 参数 d, 的 数值 表 


n dn | n dn 

2 1. 128 14 3. 407 
3 1. 693 15 3. 472 
4 2. 059 16 3. 532 
5 2. 326 17 3.588 
6 2.534 18 3. 640 
7 2. 704 19 | 3. 689 
8 2. 847 20 3.735 
9 2. 970 21 3.778. 
10 3. 078 22 3. 879 
11 3.173 23 3. 858 
12 3. 258 24 3. 895 
13 3. 336 25 3. 931 


由 于 极 差 含有 总 体 标 准 差 的 信息 ,在 正 态 总 体 场 合 , 又 有 (4. 3. 9) 式 ,因此 
统计 学 家 建议 在 小 样本 时 ,用 下 式 去 估计 正 态 总 体 的 o, 记 为 
Gr= R/d, (4. 3. 10) 
此 估计 在 > 和 10 时 效果 较 好 。 
例 4.3.4 甲乙 、 丙 三 厂 生产 同一 零件 ,订货 方 为 了 了 解 各 厂 生 产 的 零 
件 强 度 的 差异 ,以 便 从 中 选择 订货 的 工厂 。 现 从 市 场 上 各 购买 4 个 零件 , 测 其 
强度 , 测 得 的 数据 如 表 4. 3. 3 所 示 ,强度 服从 正 态 分 布 已 为 过 去 的 试验 数据 所 
证 实 。 : 
— 43.3 三 个 厂 的 零件 强度 数据 及 基本 统计 量 


工厂 零件 强度 平均 强度 元。 MER kiko 


四 115 116 98 83 103 33 16.0 
乙 103 107 118 116 111 | 15 7.3 
丙 73 89 85 97 86 24 11.7 


A p mm en + 


根据 表 4. 3. 3 的 数据 ,可 求 得 甲 三 的 平均 强度 与 极 差分 别 为 : 


z=- (115+116+98+83)=103 


R=116—83=33 
利用 公式 (4. 3. 10) 可 求 得 o 的 估计 值 , 由 表 4. 3. 2 查 得 n= 二 4 时 d, =2. 059,4 
ĉr = 33/2. 059=16. 0 
对 乙 厂 和 丙 厂 的 强度 数据 亦 可 类 似 计算 ,所 有 计算 结果 都 列 在 表 4. 3. 3 
右 侧 三 列 。 
从 计算 结果 看 , 乙 厂 的 平均 强度 最 高 (z= 二 111) ,而 标准 差 最 小 (64 二 7. 3). 
为 两 个 厂 的 零件 强度 都 不 理想 , 甲 厂 的 零件 强度 的 标准 差 过 大 ,表明 该 厂 生产 
不 稳定 ,这 从 它 的 4 个 强度 数据 很 分 散 即 可 看 出 , 丙 厂 的 零件 强度 的 平均 值 过 
小 。 相 比 之 下 : 甲 三 与 丙 厂 的 零件 质量 差 ,不 宜 订 货 。 
AR 4. 3. 3 右 侧 所 列 的 三 个 基本 统计 量 ( 平 均 强 度 范 , 极 差 R, 标 准 差 ôr) 
可 以 清楚 地 看 出 三 个 厂 生产 的 零件 的 优 劣 ,这 便 是 统计 量 的 作用 ， 
从 上 面 的 例子 可 见 , 用 (4. 3.10) 式 从 极 差 去 估算 标准 差 很 方便 ,但 极 差 也 
有 缺点 ,这 便 是 它 极 易 受 个 别 异 常 值 ( 又 称 离 群 值 ) 的 干扰 。 
例 4.3.5 砖 的 抗 压强 度 ( 单 位 :MPa) 服 从 正 态 分 布 已 被 证 实 ,对 一 批 将 
交付 客户 的 砖 ,从 中 随机 抽取 10 个 样品 , 测 得 砖 的 抗 压 强度 为 (已 排序 )， 
4.7 5.4 6.0 6.5 7.3 7.7 8.2 9.0 10.1 17.2 
可 求 得 这 个 样本 的 极 差 
R=17. 2 一 4.7 一 12.5 
从 而 标准 差 的 估计 为 
6r=12. 5/3. 078=4. 06 
后 经 检查 发 现 , 样 本 中 的 蜡 常 值 17. 2 属 抄录 之 误 , 原 始 记录 为 11. 2, 把 17.2 
改正 为 11. 2 后 ,新 数据 对 应 的 极 差 与 标准 差 的 估计 分 别 为 ， 
R=11.2-4.7=6.5 
ér=6. 5/3. 078=2. 11 
这 时 极 差 与 标准 差 都 缩小 了 将 近 一 半 , 可 见 个 别 异 常 值 对 极 差 的 影响 是 很 大 
的 。 这 便 是 样本 极 差 这 一 统计 量 的 缺点 昂 受 异常 值 的 干扰 ,因此 在 使 用 中 
要 加 以 注意 。 


4.3.4 ”样本 中 位 数 与 pp 分 位 数 
定义 4.3.3 ”样本 按 大 小 次 序 排列 后 处 于 中 间 位 置 上 的 统计 量 称 为 样本 
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E a erkereee 一 


中 位 数 ,常用 Ma 表示 。 
设 Xi XX 是 来 自 某 总 体 的 一 个 样本 ,其 次 序 统计 量 记 为 Xos 
X 01 <""<X w , 则 


Aa Me n 为 奇数 


(4. 3.11) 
S[X(3)+X(24)], "ABR 


例 4.3.6 设 容量 为 5 的 样本 观察 值 为 3,5,7,9,11, 则 样本 中 位 数 ma 一 
7。 如 果 增 加 一 个 样本 观察 值 15, 那 么 样本 中 位 数 mu 一 二 (7 十 9) 一 8， 
样本 中 位 数 的 一 个 优点 是 受 异 常 值 的 影响 较 小 .譬如 在 例 4. 3.5 中 ,无 论 


最 大 值 是 17. 2 还 是 11. 2 ,其 中 位 数 都 是 ms 一 二 (7. 3 十 7.7) 一 7.5。 


样本 中 位 数 m 表示 在 样本 中 有 一 半数 据 小 于 mas 另 一 半数 据 大 于 ma. 
F, EHARA 50 位 同学 ,如 果 告 诉 我 们 该 班 学 生 身高 的 中 位 数 是 1. 69 米 ， 
那么 可 知 该 班级 中 一 半 学 生 的 身高 高 于 1.69 米 , 另 一 半 学 生 的 身高 低 于 
1. 69 米 。 样 本 中 位 数 反 映 了 总 体 中 位 数 的 信息 。 
我 们 知道 总 体 的 数学 期 望 4 与 中 位 数 xo.s 都 反映 了 总 体 的 位 置 特征 。 当 
分 布 对 称 时 , 璧 如 正 态 分 布 , 则 y==zxos, 但 对 偏 态 分 布 来 讲 , 正 偏 的 有 p>zo.s， 
仙 偏 的 有 .二 zo.;。 有 了 样本 均值 与 样本 中 位 数 后 ,也 可 大 致 了 解 分 布 的 形态 。 
MR 却 =zzzu, 总 体 分 布 可 能 比较 对 称 ; 如 果 - 元 > 那么 总 体 分 布 可 能 为 正 偏 
的 ;而 mM 时 ,总 体 分 布 可 能 为 负 偏 的 。 
例 4.3.7 有 位 顾客 要 买房 子 , 当 地 房地产 经 销 商 向 他 介绍 房子 时 还 化 
费 吉 心地 告知 :这 一 带 居 民 的 平均 年 收入 约 为 15000 美元 ”可 能 就 是 这 一 点 
使 该 顾客 下 了 决心 买 下 房子 , 住 到 这 里 ,并 记 住 了 这 个 迷人 的 数字 。 一 段 时 间 
后 ,周围 居民 向 当局 申请 公共 汽车 费 不 要 涨 价 , 理 由 是 ;这 一 带 居 民 的 平均 年 
收入 只 有 3500 美元 ,提高 以 后 支付 不 起 。 他 听 到 这 个 数字 后 ;大吃一惊 :“ 啊 
呀 ! 哪 个 数字 是 真实 的 呢 ?” 为 此 ,该 顾客 作 了 些 调查 ,惊讶 地 发 现 , 这 两 个 数字 
都 是 合法 地 计算 出 来 的 ,两 个 数字 所 代表 的 都 是 同样 的 人 同样 的 收入 。 那 么 误 
解 是 怎么 产生 的 呢 ? 问题 就 在 于 有 些 生 意 人 在 不 同时 机 采用 不 同 的 平均 数 。 
平均 数 ” 这 个 词 的 词义 很 广 , 它 可 以 是 均值 ,也 可 以 是 中 位 数 。 当 你 想 要 高 数 
字 时 ,就 用 15000 美元 ,这 是 当地 居民 收入 的 算术 平均 数 , 而 当 你 要 小 数字 时 ， 
就 用 3500 美元 ,这 是 当地 居民 收入 的 中 位 数 。 当 地 有 一 半 居 民 年 收入 低 于 
3500 美元 , 另 一 半 居 民 年 收入 高 于 3500 美元 ,特别 是 该 地 有 三 户 是 回来 度 周 
末 的 百 万 宣 伍 ,就 是 这 几 户 使 算术 平均 数 大 幅度 上 升 。 正 因为 居民 年 收入 的 分 
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布 不 是 对 称 的 ,而 是 正 侦 的 ,高 收入 部 分 的 尾巴 较 长 造成 的 (此 例 摘 自 R. Huff 
《年 能 利用 统计 撒 谋 》, 中 国 统计 出 版 社 ,1989) 。 

上 上 面 例子 告诉 我 们 ,在 人 们 告知“ 平均 数 "时 应 该 搞 清 楚 它 指 的 究竟 是 什 
么 。 如 条 总 体 分 布 对 称 时 ,算术 平均 数 与 中 位 数 差不多 ,而 当 分 布 不 对 称 时 ，, 必 
须 搞 清 它 指 的 是 算术 平均 数 还 是 中 位 数 。 

定义 4.3.4 B Xi Xo Xn 是 来 目 某 总 体 的 一 个 样本 ,其 次 序 统 计量 
AX10<X o << <ÉX mm HA 分 位 数 m, 是 指 由 下 式 求 得 的 统计 量 ， 


k 
X mw > ot 
m, = | k4] (4.3.12) 
Xot l Xaron — Xæ Latip —k], == 7 十 1 


不 难看 出 ,(4. 3. 12) 式 中 的 & 是 不 超过 (nn 十 1)p 的 最 大 整数 ， 
样本 的 pp 分 位 数 m, 表示 容量 为 的 样本 中 约 有 np 个 数 小 于 m, CEE 
一 种 表示 位 置信 息 的 统计 量 ， | 
B14.3.8 设 从 总 体 久 中 抽取 了 容量 为 n= 二 99 的 样本 X Xs Xo DI 


p=0. 1 的 分 位 数 mi =X ao REAA 10 一 9 一 0.1, 故 4 一 10。 如 果 样 本 


n+1 100 
容量 为 100, 则 由 于 2 了 <0. 1< A moi =X 007 (XK a) — Xan) [101 0. 1 


—10]=0. 9X av +0. IX a) , 它 是 两 个 相 邻 次 序 统 计量 的 加 权 平 均 。 
p=0.5H,m, 即 为 样本 中 位 数 ma. 发 外 ,在 描述 数据 位 置 时 常用 到 四 分 
位 数 , 即 p=0.25 5 p=0.75 HIM mo: E m0.1s;, 并 常 将 它们 记 为 Q) 与 


Q,, 分 别称 它们 为 第 一 四 分 位 数 与 第 三 四 分 位 数 , 它 反映 了 有 十 的 数据 小 于 


Q,, 有 才 的 数据 大 于 Qs, 而 有 一 半数 据 介 于 O, 与 Qs 之 间 。 在 统计 推断 中 常 要 
用 到 如 一 0.01,0. 05,0. 1 与 0.9,0.95,0.99 等 对 应 的 分 位 数 。 

为 求 样本 p 分 位 数 ,首先 要 对 数据 进行 排序 ,然后 才能 利用 (4. 3. 12) 式 
RR m 。 如 果 容 量 为 n 的 样本 能 给 出 34.1 中 所 述 的 茎 叶 图 ,那么 用 来 求 m, 
就 十 分 方便 。 

例 4.3.9 对 例 4.1. 8 中 给 出 的 样本 求 Lora Ma Qi Qs. 

解 :由 于 在 例 4. 1. 8 PONE TERA, RAE RAT 
排序 ,由 图 4. 1. 8 可 知 数据 从 小 到 大 排序 后 为 ， | 

26.9 27.2 27.6 27.9 27.9 27.9 28.0 28.0 28.3 28.4 

28.5 28.7 28.7 29.1 29.5 29.6 29.8 29.9 30.0 30.1 

218 


T0 一 20.9 , Lin) =X (0) = 30. 1 


因而 | ] 
m=; Lzan tran] =z L28. 4 十 28. 5 ]=28. 45 
2 6 l5 16 
XFO. 25<77 > 791 50. 75<5 il 


Q: =x t lre Ts) (21X0. 25— 5) 
= 27. 9+ (27. 9—27. 9) X0. 25=27. 9 
Q: =zas Tías) —zras»)(21X0.75—15) 
= 29. 5+ (29. 6—29.5) X0. 75 =29. 575 


4.3.5 箱 线 图 (又 称 盒子 图 ) 

有 了 次 序 统计 量 后 ,常用 箱 线 图 来 反映 样本 提供 的 有 关 总 体 的 信息 ， 

E E 2 E E HE ETR O mas Q Tw, AREE N 
E 4. 3.3。 在 数 轴 上 方 ,Q; 与 Q; HE L— A EE) EA ARA 
数 , 和 矩形 外 画 两 条 线段 分 别 终于 XD 与 Im. 


4.3.3 箱 线 图 的 示意 图 


例 4. 3. 10 对 例 4.1.6 的 样本 数据 作 箱 线 图 ， 
解 : 由 例 4. 3. 4 求 得 的 数据 ,可 以 方便 地 画 出 箱 线 图 , 见 图 4. 3. 4、 


XA) Q, md Q, Xin) 
26. 9 27.9 28. 45 29. 5975 30. 1 
图 4.3.4 B 4.1.6 的 箱 线 图 
从 箱 线 图 可 以 形象 地 看 出 样本 的 如 下 特性 ， 
DPMB: 中 位 数 ma 所 在 位 置 即 为 样本 中 心 ,从 TB ma 和 和 从 ma 到 
zw 各 占 样本 量 的 一 半 ， 
C2) 散布 情况 :全 部 样本 位 于 [zu ,zeo] 内 , 若 将 样本 等 分 成 四 份 的 话 , 那 
么 在 [xa， Qi, LQ, Mal, L mar Qs), [Q3 20 1% 1/4. 各 区 间 较 短 时 ,特别 是 
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[zoyzoj 与 LQiQa] 较 短 时 ,表示 样本 较 集 中 ,反之 就 较为 分 散 。 

DORE :如 果 和 赴 形 位 于 中 国人 位 置 ,中 位 数 又 位 于 矩形 的 中 间 位 置 , 则 分 布 
较为 对 称 , 和 否则 是 侦 态 分 布 。 如 果 和 矩形 依 于 左 奖 ( 或 右 疾 ), 中 位 数 偏 于 息 形 左 
癌 ( 或 右 端 ), 可知 分 布 是 正信 (或 负 偏 ), 此 时 右 尾 ( 或 左 尾 ) 较 长 。 

(4) 离 群 值 ; 当 和 矩形 两 侧线 段 长 度 相 差 过 大 时 ,表明 长 的 一 侧 有 特大 (或 特 
小 ) 值 ,此 时 常 将 这 种 值 用 “x ”表示 ,而 线段 终于 dao (或 ro), ERAT 
Lay (E ia) MA 4. 3. 5)。 

由 于 从 箱 线 图 上 可 看 出 样本 分 布 的 一 些 特 性 ,因此 常 将 几 个 同类 的 样本 
数据 画 在 同一 坐标 轴 上 以 便 进 行 比较 。 

例 4.3.11 设 有 两 个 教学 班 ,各 有 50 名 学 生 , A 班 用 新 方法 组 织 教 学 ,B 
班 用 传统 方法 组 织 教学 , 现 得 期 末 考 试 成 绩 的 如 下 次 序 统 计量 : 


Tm Qı má Q T in) 
AH | 44 66.5 75 8] 96 
BH 35 56 65 83 100 


将 这 两 组 数据 在 同一 坐标 轴 上 画 上 相应 的 箱 线 图 , 见 图 4. 3.5。 从 图 上 直 
观 地 看 出 :使 用 新 教学 方法 的 4 班 成 绩 明 显 高 于 互 班 , 且 学 生成 绩 间 的 差距 
缩小 了 ;但 对 于 成 绩优 秀 的 学 生来 讲 还 是 B 班 略 多 一 些 ,可 能 新 老 教 学 方法 
对 成 绩 好 的 学 生来 讲 差不多 。 


X 
30 40 : 50 60 70 80 90 100 


4.3.5 例 4.3.11 的 箱 线 图 


4.3.6 用 随机 模拟 方法 寻找 统计 量 的 近似 分 布 

有 些 统计 量 的 抽样 分 布 难以 用 精确 方法 获得 ,在 一 些 情况 中 可 以 用 随机 
模拟 的 方法 来 寻找 统计 量 的 分 布 ,此 时 所 得 的 分 布 都 是 用 分 位 数 来 表示 的 。 

随机 模拟 的 基本 想法 如 下 : 设 总 体 XX 的 分 布 函 数 为 F(x), 从 中 抽取 一 个 
容量 为 的 样本 ,其 观测 值 为 x1,x;,… ,zx,, 从 而 可 得 统计 量 了 = 二 TC(X,,X,， 
…， 义 ,) 扑 一 个 观测 值 1。 将 上 述 过 程 重复 入 K, WIT N ARE so, 
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sta HEN 充分 大 ,那么 样本 分 位 数 的 观测 值 便 是 了 的 分 布 的 分 位 数 的 一 
个 近似 值 ,并 且 BA ,近似 程度 越 好 ,因而 可 将 它 作 为 了 的 分 位 数 。 当 改变 
样本 容量 n 时 , 则 可 得 到 不 同 容量 n 下 ,TT 的 分 布 的 分 位 数 。 

利用 随机 模拟 方法 研究 统计 量 的 分 布 的 关键 在 于 如 何 产 生 分 布 F(z) 的 
容量 为 n 的 样本 。 这 一 点 并 不 是 在 任何 分 布 场合 都 能 做 到 的 ,即使 有 可 能 ,也 
将 随 F(z) 的 具体 形式 而 定 , 下 面 的 例子 会 给 我 们 局 发 。 

例 4. 3. 12 用 随机 模拟 方法 求 来 自 N Cy,o) 总 体 的 样本 峰 度 KU 的 分 布 。 

理论 上 已 经 证 明 KU 的 渐 近 分 布 是 N(0,24), 由 于 其 收敛 速度 很 慢 , 要 
对 很 大 的 一 才能 应 用 ,因而 这 一 渐 近 分 布 的 应 用 价值 不 大 。 下 面 用 随机 模拟 方 
法 来 求 不 同 n 下 KU 分 布 的 分 位 数 。 为 此 需要 作 两 项 准备 工作 。 

进行 随机 模拟 的 首要 问题 是 要 产生 KU 的 N 个 观测 值 。 由 于 总 体 N Cp， 
5 ) 中 售 未 知 参 数 py 与 ,因而 无 法 产生 NN (py,0) 的 随机 数 ,这 时 需要 借用 分 
布 的 性 质 ,首先 把 问题 转化 为 可 以 大 量 产生 随机 数 的 分 布 。 幸 好 这 里 可 以 转化 
为 标准 正 态 分 布 。 

当 X ”一 No,1) 时 , 记 其 样本 峰 度 为 KU* ,可 以 证 明 KU* =KU. REN 


及 ;一 
HES X = O É i=] 210, WA 


KU* = l 一 3 
+æ — 2 
n Á 
DE 
n E g 
= = -3 
Al 
n E O 
1 Sx, — XY 
= 2 - 3=KU 
ES x»: | 
n= | 


因而 求 KU 的 观察 值 时 可 利用 标准 正 态 分 布 N (0,1) 的 随机 数 。 
此 外 ,为 产生 NN(0,1) 的 观测 值 ( 称 为 随机 数 ) ,可 利用 (0,1) 上 均匀 分 布 
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LÍA u iU Unte „U2 ERE (0,1) 上 均匀 分 布 的 容量 为 12 的 样本 , 则 
El SU, —6)=0, Varl SU, —6)=1 
由 中 心 极限 定理 知 ， >U; — 6 近似 服从 N(0,1) 分 布 , 故 设 ua sitas e sul JE 


(0,1) 上 均匀 分 布 的 随机 数 时 ,将 27 一 6 作为 N (0,1) 的 一 个 观察 值 .其 实 


产生 N(0,1) 随机 数 还 有 许多 方法 ,有 兴趣 的 读者 可 参看 徐 钟 济 编著 的 《蒙特 
卡 罗 方 法 》 一 书 。 
有 了 上 述 两 项 准备 ,用 随机 模拟 方法 求 KU 的 分 位 数 的 步 又 如 下 : 


12 


(1) 产生 12 个 (0,1) 上 均匀 分 布 的 随机 数 wiyuz，… su Er = > ui — 6, 


(2) 将 上 述 过 程 (1 ) 重复 n 次 , 则 产生 了 nn 个 NN(0,1) 的 随机 数 工 1 ,zz，…，Zn。 
(3) 计算 
KU = 一 一 一 一 3 
[+ Y (a, — my?) 

则 得 到 KU 的 一 个 观测 值 , 记 为 KUY., 

(4) 重 复 (1) 一 (3)N 次 ,可 得 KU 的 NN 个 观察 值 

| KUW , KU” q. JKU O 

这 里 N 是 一 个 相当 大 的 值 ,最 好 在 10000 UE. : 

(5) 将 KU 的 N 个 值 排 序 , 找 出 p= 二 0.01,0.05,0.10,… 的 分 位 数 。 

(6) 改 变样 本 容量 n, 重 复 上 述 过 程 (1)~(5), 可 得 不 同 n 下 KU 的 各 种 
分 位 数 。 

E 4. 3.4 列 出 了 N==10000, 样 本 容量 为 15,20,25 时 KU 的 分 位 数 。 

表 4. 3.4 正 态 总 体 样本 峰 度 kD 的 分 位 数 (N 二 10000 的 模 氢 结果) 
样本 容量 = 


概率 p 15 20 25 
O. 01 —1. 468 —1. 360 —1. 272 
O. 05 —1. 278 一 1. 164 —1. 081 
0. 10 一 1.158 一 1. 045 一 0. 962 
0. 90 0. 629 0. 668 0. 651 
0. 95 1. 124 1. 131 1. 106 
0. 99 2. 247 2. 306 2. 318 


E 4. 3. 4 中 的 随机 模拟 结果 表现 出 很 强 的 规律 性 ,是 可 信 的 。 
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参数 估计 


OOOO 


AECA E BAN AGAR FA 中 所 含 的 参数 &( 可 以 是 问 
” 量 ), 而 且 还 指 分 布 的 各 种 特征 数 ,如 均值 .方差 标准 差 , 相 关 和 矩 , 也 包括 各 种 
事件 的 概率 等 .对 这 些 参 数 要 精确 确定 它 是 困难 的 ,因而 我 们 只 能 通过 样本 所 
提供 的 信息 对 它 作 出 某 种 估计 。 例 如 每 加 仑 汽油 行驶 的 里 程 数 是 服从 正 态 分 
布 的 ,但 其 均值 A 与 方差 未知 ,为 此 我 们 从 中 抽取 了 一 个 样本 ,用 样本 对 jp 
与 e 作出 估计 。 这 便 是 本 章 所 要 讨论 的 参数 估计 问题 , 它 是 实际 中 最 滑 见 的 
MESE TA | 

在 本 章 中 , 设 9 是 总 体 的 一 个 待 估 参 数 ,9 的 一 切 可 能 取 值 构成 的 参数 衬 
间 记 为 日 .X1, 头 ;,… X, 为 从 总 体 中 抽取 了 一 个 容量 为 的 样本 ,其 观测 值 记 
A 

参数 佑 计 的 形式 有 两 种 :点 估计 与 区 间 售 计 。 

在 参数 的 点 估计 中 ,是 要 构造 一 个 统计 量 9 = 2CX X 2300 X 1) ,然后 用 0 
去 估计 9, 称 9 为 6 的 点 估计 或 估计 量 , 或 简称 估计 ,将 样本 观测 值 代入 后 便 得 
到 了 2 的 一 个 点 估计 值 0(zi 2 ,zx,) ,在 不 致 混淆 的 情况 下 均 用 ! 表 示 。 

在 参数 的 区 间 估 计 中 ,是 要 构造 两 个 统计 量 9 与 外 , 且 过 久 , 然 后 以 区 
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1 LO, 001 的 形式 给 出 未 知 参数 2 的 估计 ,事件 “区 间 [ 妨 ,oo 含有 22 的 概率 称 
为 置信 水 平 . 

本 章 将 先 讨论 获得 点 估计 的 两 种 第 用 方法 ,它们 是 矩 法 估计 与 极 大 似 然 
佑 讨 ,并 讨论 评价 佑 计量 好 坏 的 标准 ,然后 再 讨论 区 间 佑 计 问 题 ,最 后 对 贝 叶 
斯 点 估计 与 区 间 信 计 作 一 简单 介绍 。 


$5.1 AA 


1900 年 英国 统计 学 家 K. Pearson 提出 了 一 个 替换 原则 ;用 样本 矩 去 替换 
总 体 矩 ,后 来 人 们 就 称 此 为 矩 法 估计 ， 


5.1.1 掉 法 估计 的 基本 点 

忠 法 估计 的 基本 点 是 :用 样本 矩 估 计 总 体 矩 ,用 样本 和 矩 的 相应 函数 估计 总 
体 窍 的 函数 ， : 

设 X, Y PO 是 来 目 某 总 体 X 的 一 个 样本 , 则 样本 的 k REN : 

| a=19x 9 k = 1,2,+** 
MALA X H k RRR a = EQ) 存在, 则 用 A 去 估计 py, 记 为 
fir = A, 
例 5.1. 1 设 总 体式 =—b(1,p) ,从 中 获得 样本 Xis Aast, Xn 由 于 ECX) 
2 一 4, =X 

设 样 本 的 观察 值 为 zi ,zx:,… ,xz,, 那 么 每 一 个 zx; 不 是 0 便 是 1, 从 而 $ 的 观察 值 
便 是 | 
了 Zn 中] 的 个 数 


这 便 是 频率 。 
例 5.1.2 设 总 体式 具有 方差 5 ,从 总 体 中 获得 样本 及 | Ago ¡An , 由 于 
a = Var(X) = E(X?) — (EXY = m — gf 
那么 分 别 用 As 估计 e, Ar 估计 ,从 而 其 函数 o? 的 矩 法 估计 为 
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a rr rr a a 


这 便 是 样本 的 二 阶 中 心算 Ba ,而 Var(X) EA AE v i 


v = B, 
— E AR k PGE n FA) HEA ERK k i POE Be Bi: 
v = B, 


矩 法 估计 的 优点 是 不 要 求知 道 总 体 的 分 布 ,因而 矩 法 估计 获得 了 广泛 的 
FH, 


5.1.2 分布 中 未 知 参数 的 矩 法 估计 

当 总 体 分 布 类 型 已 知 时 ,但 含有 未 知 参数 ,有 时 也 可 用 和 矩 法 获得 未 知 参 数 
的 估计 。 

设 总 体 关 的 分 布 清 数 中 含有 kk 个 未 知 参 数 0.,0,,… O) HAA IR TRE 
存在 ,它们 都 是 ,0,,…,0; 的 函数 ,此 时 求 6,( = 1,2, sk) 的 矩 法 估计 的 具 
体 步 又 如 下 : 

(1) RE ECX) = pj = 1,2, k HRE 


Hj = 80 02,00), j= 1,2, k (5.1. 1) 
(2) 解 方程 组 (5. 1.1) 得 : 
O, = hs Hast spa), i= 1,2) 0, k (5.1. 2) 
(如 有 果 可 能 求解 的 话 ) 


(3) 在 (5.1.2) 中 ,用 4 代 岂 一 1,2,… 光 , 则 得 六 ,2 ,4 的 矩 法 估计 

为 : 
Ô; =h CA Azor A), i=1,2,.,k (5.1. 3) 

(4) 如 果 有 样本 观察 值 , 则 将 它们 代入 (5. 1.3) 得 0 ,0 ,9 的 估计 值 ， 

有 时 为 方便 起 见 , 在 (5.1. 1) 或 (5. 1. 2) 中 会 出 现 总 体 的 中 心 矩 等 ,这 
时 可 用 B; 代替 Vjo 

例 S.1.3 设 X;,X,,…,X, 是 来 自 均匀 分 布 U(a,5) 的 一 个 样本 , 试 求 a， 
b MEt. 

解 :(1) 由 于 总 体 X —UCa,b), Mi 


_ 2 
Li = ECX) 二 < 7 2 Y» = Var(X ) = a 
2) 从 上 面 两 个 方程 可 解 得 a 与 5, 由 
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a rp a 


人 
bp— a 一 V 12v, 


al 
Am 


NS 
b= m + V 3v, 
(3) H A = X 5 B, = S aE 1 与 y, MIG a E o WETA 


por V35? = X— vV 3S, 


b = X +N3S =X +vV35S, 


例 5.1.4 ZA Xp DE 是 来 日 六 分 布 PCa,A) 的 一 个 样本 , 试 求 a,A 
的 窍 法 估计 。 


¡OD 由 于 总 体 X ~ T(a,A), 有 


| 1 = E(X) 一 5, v = Var(X) = — 
(2) 从 上 述 方程 组 可 解 得 
a 一 pi A 二 名 


(3) 用 XX 与 Si 分 别 替换 jp 与 名, 则 得 a 与 4 的 窍 法 估计 为 . 
~ X? > X 
4 一 S2 , À = S? 
ERRATA A, PERA MARIE. ER Y 
E AM — y EMBAR RAR PO) EF HIERE A, AMO A X Ei 


HA BAS ATT A IPR E E E 27 AEB, MM 
不 够 稳健 。 


$ 5.2 ”点 估计 优 劣 的 还 价 标准 


参数 的 点 估计 实质 上 是 构造 一 个 估计 量 去 估计 未 知 参数 ,上 节 讲 的 矩 法 
估 计 是 用 各 种 矩 去 构造 估计 量 的 一 种 方法 .对 一 个 未 知 参数 9, 人 们 可 以 构造 


多 个 估计 量 去 佑 计 它 ,譬如 ,在 上 一 节 中 提 到 , 当 总 体 X BRA BA A NE 
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Her 


分 布 时 ,由 于 无 (X) = å, Var(X) 一 人 ,因此 的 征 法 估计 可 以 有 两 个 : 
A, =X 


一 Ly (X, — Xy? 
其 实 我 们 还 可 以 用 其 它 方法 构造 % 的 多 个 售 计 ， 辟 如 用 术 本 中 位 数 mw, 用 
方 (Xo t Xo) 等 等 从 而 产生 了 一 个 问题 :究竟 用 哪 一 个 估计 量 去 估计 为 好 


呢 ? 为 此 需要 有 评价 估计 好 坏 的 标准 ,标准 不 同 , 答 案 也 会 有 所 不 同 .本 市 介绍 
几 个 第 用 准则 。 


5.2.1 无 偏 性 

设 记 与 记 是 0 的 两 个 估计 量 , 其 概率 密度 函数 如 图 5. 2. 1 所 示 。 从 图 中 可 
见 , 记 的 取 值 分 布 在 待 估 参 数 9 的 两 侧 , 由 样本 求 得 的 估计 量 的 观察 值 与 9 会 
有 偏离 ,这 种 偏离 有 时 大 些 , 有 时 小 些 , 有 时 为 正 , 有 时 为 全 ,但 从 平均 意义 上 
XH, Eð, 与 09 一致 .而 的 取 值 唱 也 分 布 在 待 佑 参数 9 的 两 侧 , 但 由 样本 求 得 
的 估计 量 的 观察 值 与 86 相 比 ,小 的 为 多 ,大 的 为 少 ,从 平均 意义 上 讲 ,E0, <O, 


EQ@ 0=E6 
图 5.2.1 2 与 2 的 概率 密度 曲线 的 示意 图 
(小 是 6 的 无 偏 估计 ) 


我 们 希望 所 得 的 估计 9 从 平均 意义 上 来 讲 与 9 越 接 近 越 好 , 当 其 差 值 为 0 
时 便 产 生 了 无 偏 估计 的 概念 

定义 5.2.1 设 0= IX, Xar X 是 参数 0 的 估计 量 , 如 果 

E0=0 OOEB (5. 2.1) 
则 称 0 是 2 的 无 偏 估计 ,否则 称 为 有 偏 估计 .这 里 @ 是 0 的 参数 空间 。 

例 5.2.1 设 总 体式 具 有 & 阶 矩 , 匹 8 一 MA, 则 样本 的 上 阶 原点 矩 As 是 
pa 的 无 偏 估计 。 | 

UE: MEA X 中 获得 样本 X1)X 290, Xn 则 由 XA Az) tX, 独立 同 分 布 
AJA EX? = pi = 12,…,n, 从 而 

PAA 


ECD = EG S XD =Z JE ==, y = 1 
所 以 Ar 是 14 的 无 侦 佑 计 。 
例 5.2.2 设 总 体 X 具 有 二 阶 矩 ,天 (X) = p, Var(X) 一 条 ,从 中 获得 样 
本 Xi Xose Xn M X Æ u att E Si 不 是 天 的 无 侦 佑 计 , 而 3 是 
的 无 偏 估计 。 
证 :由 例 5. 2. 1 可 知 当 二 18,4, 一 X 是 px 的 无 仿 信 计 , 求 E(S»)， 
由 于 


AR ES GR EX; 5 EX”; 
EX; = Var(X) + (EX = 4 pP , 21=15,2,**,mn 


2 
EX? = Var(X) + (EX)? = 一 十 jz 


代入 得 ， 
Esp=1 t p) Eee 
r n 拓 ; z n a n 
因而 S; Ad 0? R ET. 
又 | 
E(S%) = E |- n . E(S2) = —— NE m S E. 
n— 1 n — 1 n — 1 n 


所 以 5S: 是 6 的 无 偏 估计 ,所 以 在 不 少 场合 ,特别 在 小 样本 场合 ,人 们 常用 5S? 去 
估计 吗 。 所 以 S 称 为 无 偏方 差 。 

对 S2 而 言 ,尽管 它 不 是 到 的 无 偏 估 计 , 然 而 当 n 一 oo 时 ,有 

UMES: = 0 

我 们 称 S 是 a? 的 渐 近 无 偏 估 计 。 

当 Y 是 9 的 无 偏 估 计时 , 若 用 gC6) 去 估计 参数 g(0) ,那么 g(00) 通常 不 再 
是 g (0) 的 无 偏 估 计 , 在 例 5.2.2 中 ,我 们 证 明了 SS 是 有 的 无 偏 估计 ,但 是 5S 不 
是 o 的 无 偏 估计 。 下 面 的 例子 说 明了 这 一 点 。 

例 5.2.3 MX, XX, 是 来 自 正 态 总 体 Ne 00 的 一 个 样本 ,其 中 
L REN , UE RH 

o, = CS 
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是 o 的 无 偏 估计 ,其 中 


r| 2— L} : 
n— 1 2 Ea l 2 
Cp = 2 . r 2 , 5 —— 124% X) 
2 
— 2 2 
A 一 1), 若 令 Y 一 外 一 一 , 则 Y 的 密度 函数 为 
1 nl ] 2 
pOY)=— vy? e2, y>0 
22r 2) 


从 而 
E(Y?) = | wpady 


1 E — 
一 一 — — y2 e zdy 
ln n 1 0 
2 
22T| 5 ey 
== — ~ s 
El n— L} 2 r n — ! 
2 2 
| 1 Jn — 1E(S) 
男 一 方面 EY?) = p , 故 有 
r n 
aj 1 2 2 2] 
ECS) = -oE (Y?) = e. —— =A m TT 
O = EYD =y IES 
2 
表 5.2.1 正太 标准 差 的 无 偏 系数 表 ， 
n Ca n C, 
2 1.2533 14 1. 0194 
3 1.1284 15 1.0180 
4 1. 0854 16 1.0168 
5 1. 0638 17 1.0157 
6 1.0510 18 1. 0148 
7 1.0423 19 1. 0140 
8 1.0363 20 1. 0133 
9 1.0317 21 1.0126 
10 1. 0281 22 1.0129 
11 1.0252 23 1.0114 
12 1.0229 24 1.0109 
13 1.0210 25 1. 0105 
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从 而 

G, 一 CS 
是 o 的 无 偏 估计 。 表 5.32.1 给 出 了 二 20025 的 无 偏 系数 表 , 供 实际 使 用 ,从 
RPA N, 4 n RERA C, 就 越 来 越 接 近 于 1 。 / 


5.2.2 ”有 效 性 

在 实际 问题 中 ,人 们 常常 首先 关心 的 是 估计 的 无 偏 性 ,但 是 一 个 参数 的 无 
偏 估 计 可 以 有 许多 ,那么 在 这 些 估计 中 取 哪 个 为 好 呢 ? 直 观 的 想法 是 希望 所 找 
到 的 估计 围绕 其 真 值 的 波动 越 小 越 好 , 即 要 求 估 计量 的 方差 小 ,从 而 6 与 9 有 
较 大 偏差 的 可 能 性 小 ,如 图 5. 2.2 中 给 出 了 8 的 两 个 无 偏 估计 外 与 及 其 密 
度 函 数 的 图 形 , 从 图 上 可 见 Yar(0,) < Var(6,), 因 而 我 们 可 以 用 估计 量 的 方 
差 去 衡量 两 个 无 偏 佑 计 的 好 坏 , 从 而 引入 无 偏 估 计 有 效 性 的 标准 。 


O, 的 密度 曲线 
ra 


O, 的 密度 曲线 
Pa 


0-a 80 0+0 
5.2.2 ONMA TIRADA 


定义 5.2.2 Rô =0(X XXX 与 0 一 四 (XXX,) 都 是 参 
数 8 的 无 偏 估 计 , 如 末 
Var(0) 才 Var(d,) , 0€ 8 (5. 2. 2) 
月 至 少 对 一 个 0, E @, 有 严格 不 等 号 成 立 , 则 称 Â, 比如 有 效 ， 
例 5.2.4 R Xi Xote X, ÆRA I X WEE, H EX = y, Mil 
m=X, =X, 


Var (g == Z Var (g) == g? l 


n 


K4 n > 2 HH, Vara) < Var) ,因而 六 比 记 有 效 。 


5.2.3 ” 均 方 误差 准则 
对 9 的 两 个 无 偏 估计 ,我 们 可 以 通过 比较 它们 的 方差 来 判断 哪个 更 好 ,但 
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对 有 偏 估计 来 讲 ,比较 方差 意义 不 大 ,我 们 关心 的 是 估计 值 围绕 其 真 值 波动 的 
大 小 ,因而 引入 均 方 误差 准则 。 

定义 5.2.3 设 岂 与 卢 是 参数 0 的 两 个 估计 量 , 如 果 

E(0, — 0P LEÔ, — 0 , 0EO (5.2. 3) 

且 至 少 对 一 个 b% € @, 有 严格 不 等 式 成 立 , 则 称 在 均 方 误差 意义 下 ,0 优 于 ô. 
HP EO 一 07 称 为 b; 的 均 方 误差 , 常 记 为 MSE C0.)，。 

例 5.2.5 设 总 体 入 一 Mpa2)， 入 中 获得 伴 本 全 人 “Xn WEN 
误差 意义 下 比较 下 面 两 个 估计 的 优 劣 : 


2 _ 3 O Fa O g? 
¿= Da X=S 


2 =D AX 
解 : 由 例 5.2.2 知 5 是 的 无 偏 估计 ,因而 其 均 方 误差 即 为 其 方差 ,在 正 
saa LA — ¿A — X= X(n 一 1), 从 而 
var[ ® = |- 2(n — 1) 
于 是 ,Var(ci) = mp 
E(ó? — o2)2 = Var(O3) = 2 


然而 o; 是 e 的 有 偏 估计 ,其 均 方 误差 
12 (X: — XY 一 o | 


一 g| =D ZDS o? | 


Elo? — o?)? = E|- 二 


Si 
2 2 el 
= EM 二 1 To) pp | 
, 2 
= (27 Var(s) + |- an 
==" 20 E: A 7 
n+1 n— 1 (2 十 1)2 n+] 
FG < 吉 本 , 故 在 均 方 误差 意义 下 ,有 偏 估计 学 比 无 偏 估计 8? 要 好 


由 本 例 可 知 ， AMIA, M S? 估计 性 是 好 的 ,但 从 均 方 误 差 意义 
上 讲 用 o 估 计 o 为 好 。 它 们 从 不 同 侧面 去 考察 估计 量 的 好 坏 , 至 于 具体 采用 
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什么 估计 则 需 根据 实际 问题 来 定 。 


5.2.4 ”相合 性 | 
随 着 样本 容量 的 增 大 ,一 个 好 的 估计 9 应 该 越 来 越 人 靠近 其 真 值 9, 使 偏差 
19 一 9| 大 的 概率 越 来 越 小 .这 一 性 质 称 为 相合 性 。 
定义 5.2.4 设 对 每 个 自然 数 n,0, = 0CX XXX ) 是 2 的 一 个 估计 
量 , 如 果 对 任意 ee 二 0, 当 n 一 oo 时 ,有 
P(|ĝ, — 0| > — 0 (5.2.4) 
则 称 凡是 9 的 相合 估计 。 
为 说 明 样 本 不 阶 矩 A. RAR TRE mA 的 相合 估计 ， 先 不 加 证 明 给 出 一 个 
ACE 
定理 5.2. 1( 辛 钦 大 数 定律 )” 设 闫 |,, 义 ,,…,XX,,… 是 独立 同 分布 随 机 变 
量 序列 ,者 其 具有 有 限 的 数学 期 望 w, 则 对 任意 的 se 盖 0, 有 
imP| | 45x, — x| >< = 0 (5.2.5) 
当 总 体 & 阶 定 p 存在 时 ,由 样本 和 ,XXX 的 独立 同 分 布 , 可 知 
Xi,XX2,… Xas e 也 独立 同 分 布 ,由 于 EX} = pu 存在 ,从 而 由 辛 钦 大 数 定律 便 
有 


>e) = 0 


limP| lx — ly 
这 就 表明 As Je Pe 的 相合 估计 。 
当 O, VAN) 分 别 是 0, 407,0, 的 相合 估计 时 , 若 g (0 Oz.” Oe) 为 连 
续 函 数 , 则 g (0,,0,,… 01) 是 g (0 ,0,,.… ,0;) 的 相合 估计 .由 此 可 知 , 伴 本 方差 
SiD- = LY) xXx Ay ATENEI m — pi 0 
的 相合 佑 计 。 


95.3 RADA SI 


5.3.1 极 大 似 然 估 计 的 思想 与 概念 
当 总 体 分 布 类 型 已 知 时 , 极 大 似 然 估 计 是 一 种 常用 的 估计 方法 。 极 大 似 然 
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估计 第 用 MLE 表示 。 

为 了 了 解 这 一 方法 的 思想 , 先 看 一 个 例子 。 

例 5.3.1 设 有 甲乙 两 个 口袋 ,和 袋 中 各 装 有 4 个 同样 大 小 的 球 , 球 上 分 
别 涂 有 白色 或 黑色 ,已 知 在 甲 袋 中 黑 球 数 为 1, 乙 袋 中 黑 球 数 为 3。 

(1) 现任 取 一 袋 ,再 从 该 袋 中 任 取 一 球 ,发 现 是 黑 球 ,试问 该 球 最 象 取 目 
mW? 

(2) 现任 取 一 袋 ,再 从 该 袋 中 有 返回 地 任 取 三 个 球 , 其 中 有 一 个 黑 球 , 试 
DIA E E PEL ES 

解 :(1) 设 p 为 抽 到 黑 球 的 概率 ,从 甲 袋 中 抽 一 球 是 黑 球 的 概率 为 p = 


廊 , 从 乙 伐 中 抽 一 球 是 黑 球 的 概率 为 pz = HIT PL 之 pm, 这 便 意 味 着 此 黑 


球 来 自己 袋 的 可 能 性 比 来自 甲 袋 的 可 能 性 大 。 因 而 我 们 会 判断 该 球 象 是 来 自 
乙 袋 。 
(2) 设 X 是 抽取 三 个 球 中 黑 球 的 个 数 , 又 设 户 为 袋 中 黑 球 所 占 的 比例 , 则 


P(X = k) E (Aa — pm, k = 0,1,2,3 


在 = 二 1 时 ,不 同 p 值 对 应 的 概率 分 别 为 ; 
1 


pr = 8: (1). | 


P, (X =1)=3- PE 2-2 
EF P(X = 1) >P¿(X = 1), 因 而 我 们 判断 ,此 三 球 最 象 是 取 自 甲 袋 。 

在 上 面 的 例子 中 , 是 分 布 中 的 参数 , 它 只 能 取 两 个 值 :pn 与 pz, 需 要 通 
过 抽取 样本 来 决定 分 布 中 参数 究竟 是 pr 还 是 pz 在 给 定 了 样本 观测 值 后 去 
计算 该 样本 出 现 的 概率 ,这 一 概率 依赖 于 p 的 值 ,为 此 需要 用 pm、pz 分 别 去 
计算 此 概率 ,在 相对 比较 之 下 ,哪个 概率 大 , 则 p 就 最 象 那个 ， 

极 大 似 然 估 计 的 基本 思想 就 是 根据 上 述 想 法 引伸 出 来 的 。 设 总 体 舍 有 竺 
ESR 9, 它 可 以 取 很 多 值 , 我 们 要 在 9 的 一 切 可 能 取 值 之 中 选 出 一 个 使 样本 
观测 值 出 现 的 概率 为 最 大 的 0 EGEA D 作为 9 的 估计 ,并 称 9 为 9 的 极 大 似 
然 估计 。 

下 面 分 X 的 分 布 是 离散 的 与 连续 的 两 种 情况 加 以 讨论 ， 

第 一 种 ,离散 分 布 场合 的 极 大 似 然 估计 。 

设 和 的 分 布 是 离散 的 ,分 布 中 含有 未 知 参数 9, 记 为 


P(X = a) = p(a;;0) T = 1,2,“ EO 
现 从 总 体 中 抽取 容量 为 的 样本 ,其 观测 值 为 1 2 + 2 AEAT T A a, 


… 中 的 某 个 值 ， 该 样本 的 联合 分 布 为 pz ;0) .由 于 这 一 概率 依赖 于 未 
知 参数 6, 因 而 可 将 它 看 成 是 0 的 函数 ， 称 为 似 然 函 数 , 记 为 LO); 


L(0) = I ec ;0) (5. 3. 1) 


对 不 同 的 0, 同一 组 样本 观察 值 x ,zx;,… ,zc 出现 的 概率 上 (9) 也 不 一 样 。 我 们 
知道 , 当 P(4)>>P(B) 时 ,事件 4 出 现 的 可 能 性 比 事件 本 出 现 的 可 能 性 大 ,如 
果 样 本 观察 值 zi ,x2，,… ,zx 出 现 了 ,当然 就 要 求 对 应 的 似 然 函 数 L(9) 的 值 达 
到 最 大 ,所 以 我 们 选取 这 样 的 9 作为 6 的 估计 ,使 得 
L(0) = maxL (0) 

假如 0 存在 的 话 , 则 称 0 为 9 的 极 大 似 然 估 计 。 

第 二 种 ,连续 分 布 场合 的 极 大 似 然 估计 。 

当 X 的 分 布 是 连续 时 ,其 概率 密度 函数 为 p(x;0) ,其 中 0 为 末 知 参数 ， 
0 E98. 现 从 该 忆 体 中 获得 容量 为 n 的 样本 观测 值 zi ,zz，… Ln) UTE Xi S z, 


X, 一 zs,…,X, = zx, 时 联合 密度 函数 值 为 pCzi;9), 它 也 是 9 的 函数 ,也 称 
为 似 然 函 数 , 记 为 
L) = I px;0) (5. 3. 2) 


对 不 同 的 0, 同一 组 样本 观察 值 Lyra” Ly 的 联合 密度 函数 值 也 是 不 同 的 
因而 我 们 选择 6 的 极 大 似 然 估计 0 应 满足 
L(0) = maxL(0) 


5.32 求 极 大 似 然 估 计 的 方法 

寻求 分 布 中 末 知 参数 9 的 极 大 似 然 估计 ,首先 要 写 出 似 然 肾 数 上 (9), 即 样 
AX XX 的 联合 分 布 ;其 次 ,要 建立 一 个 新 的 观点 ,让 0 变化 ,这 时 同 
一 组 样本 的 观察 值 zl,zz，…zn 出 现 的 概率 LO 将 随 着 9 的 改变 而 改变 。 由 
于 当 P(4) > P(B) 时 ,事件 4 出现 的 可 能 性 比 事件 B 出 现 的 可 能 性 大 ,如 今 
样本 观察 值 zi ,zt;,… 2 出现 了 ,那么 它 对 应 的 似 然 函 数值 应 达到 最 大 ,因而 
求 8 的 极 大 似 然 估 计 就 是 求 使 LO) 达到 最 大 的 30, 

下 面 分 两 种 情况 加 以 讨论 。 
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5.3.2.1 可 通过 求 导 获 得 极 大 似 然 估计 的 情况 

当 嚼 数 关于 参数 可 导 时 ,常常 可 以 通过 求 导 方法 来 获得 似 然 函 数 极 大 值 
对 应 的 参数 值 。 

在 求 极 大 似 然 佑 计时 ,为 求 导 方便 , 常 对 似 然 函数 元 (0) 取 对 数 , 称 1(0) = 
NLO 为 对 数 似 然 函 数 , 它 与 乙 (9) 在 同一 点 上 达到 最 大 。 当 7!(9) 对 2 的 每 一 
分 量 可 微 时 ,可 通过 2Z(2) 对 8 的 每 一 分 量 求 偏 导 并 令 其 为 0 求 得 , 称 

ACO) 
00; 
为 似 然 方程 ,其 中 & 是 2 的 维 数 。 

具体 步骤 用 例 5. 3. 2 来 说 明 。 

915.32 设 某 工序 生产 的 产品 的 不 合格 品 率 为 p, 抽 个 产品 作 检 验 ， 
发 现 有 了 个 不 合格 , 试 求 p 的 极 大 似 然 估计 。 

解 : 设 是 抽查 一 个 产品 时 的 不 合格 品 个 数 , 则 六 服从 参数 为 p 的 二 点 分 
布 b(1,p) ,抽查 个 产品 , 则 得 样本 X X, ,XX,, 其 观测 值 为 zyzy…yzn， 
假如 样本 中 有 了 个 不 合格 , 即 表 示 Xx1,zx;，,…,z, 中 有 T 工 个 取 值 为 1,n 一 工 个 取 
BA 0, 为 求 p 的 极 大 似 然 估 计 , 可 按 如 下 步 又 进行 

MEAR 


Lp = || pd — pr. 
i=] 
(2) 对 上 L(p) 取 对 数 , 得 对 数 似 然 函 数 
lp) = 2 [rilnp + 《1 一 ZX;)ln(1 一 p)] 


=0, j= 1,2) k (5. 3. 3) 


= nln — p) + Ya [Inp — Iina — p)] 
(D HF) 对 pp 的 导数 存在 ， HOE LC) 对 户 求 导 , 令 其 为 0, 得 似 然 方 


E: 
dp) n r [1 1 
dp yt belg +r) 
— n l . == 
=- i-p tpa- pi A 0 


(4) 解 似 然 方程 得 


(5) ABEE b= A 一 0, 这 表明 了 一 碟 可 使 似 然 函 数 达 到 最 
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大 。 
(6) 上述 叙述 对 任 一 笠 本 观察 值 痢 成 立 ， 故 用 样本 代替 观察 值 便 得 之 的 极 
大 似 然 估计 为 
p=X 
将 观察 值 代入 ,可 得 p 的 极 大 似 然 估计 值 为 
bp = z = T/n 


其 中 7 = DAIMIEL A RR KNARI, 
例 5.3.3” 设 某 机 床 加 工 的 轴 的 直径 与 图 纸 规定 的 中 心 尺寸 的 偏差 服从 
N(x,0), 其 中 Eso” 未 知 。 为 估计 e 与 0, 从 中 中 机 抽取 > 一 100 根 辅 , 测 得 其 


偏差 为 Li s Lg 0 Lio o TAR pa 的 极 大 似 然 估计 。 
解 :(1) 写 出 似 然 函 数 


r 2 Sp? 
(r;~ y) n an” 
Lo = J] -二 = eote 
(2) 写 出 对 数 似 然 函 数 
7 1 n 
(po) 一 一 y n(2ro*) — 207 La (zr: 一 y) - 


(3) 将 Lp) DN 7 7 求偶 导 ,并 令 它 们 都 为 0, 得 似 然 方程 为 : 
a = 2 (Xi— 1)=0 
i 

“(4) 解 似 然 方程 得 
=I, = LS tr, — 2) 
(5) 经 验证 q, 0? 使 1(y,0?) 达到 极 大 。 


(6) 上 述 叙 述 也 对 一 切 样 本 观察 值 成 立 , 故 用 样本 代替 观察 法 , 便 得 “与 
P 的 极 大 似 然 估计 分 别 为 : 


p=X, P= A Y St 
t=] 


如 果 由 100 个 样本 观察 什 求 得 yz; = 26( 单 位 :mm)，》\z? = 7. 04, 则 可 求 


得 4 与 的 极 大 似 然 估计 值 : 
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、 1 ~ o 
p= 100 24% 一 0. 26 


2| 7.04 — 26/100 _ 
”一 TPE — - Tol 27% |= 100 5 0. 0028 


从 前 一 节 的 讨论 可 知 e = X E t E 0? = S pE 0? IGN 
IR SIESTA A ERA ANE. 

5. 3.2.2 不 能 通过 求 导 方法 获得 极 大 似 然 估计 的 情况 

当 似 然 函 数 的 非 零 区 域 与 未 知 参 数 有 关 时 ,通常 无 法 通过 解 似 然 方程 来 
获得 参数 的 极 大 似 然 估 计 , 这 时 可 从 定义 出 发 直接 求 工 (2) 的 极 大 值 点 。 

例 5.3.4 设 总 体式 服从 均匀 分 布 (0,2)， 从 中 获得 容量 为 地 的 样本 
Apr Az Xn 其 观测 值 为 zyzz… ,Ta TAR 0 的 MLE, 

解 : 首 先 写 出 似 然 函数 ， 
q”, 0 委 Ta S Tm < Y 
0 ， 其 它 场合 
在 这 里 由 于 工 (0) 非 零 区 域 与 9 有 关 , 因 而 无 法 用 求 寻 方法 来 获得 9 的 MLE, 
从 而 转 问 由 定义 直接 求 L(0) 的 极 大 值 。 

AE LO) 达到 极 大 ,就 必须 使 9 尽 可 能 小 ， 但 是 0 不 能 小 于 zo, 因而 9 取 
zw HE LO) 达到 了 极 大 , 故 0 的 MLE 为 


0 = X n (5. 3. 4) 
下 面 来 讨论 一 下 估计 (5. 3.4) 是 否 具 有 无 偏 性 。 
由 于 总 体 久 ~ U0,0) ;其 密度 函数 与 分 布 函数 分 别 为 ， 


XI -一 
0， HE 
O, 0 


L(0) = 


F(x) = E 0 1<0O 


1, z0 
从 而 0 一 X im) H H R E BEA 


a] 
paly) = n + [Fy] py) 一 F ， 0<y<0 


0 ón 
EÊ) = ECX iw) = | 30 dy 一 pr 
0 Q 


— 71 
n+1 
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这 说 明 O 的 极 大 似 然 估计 8 = Xa 不 是 2 的 无 偏 估计 ,但 对 8 作 一 修正 可 得 6 
的 无 偏 估计 为 : 


0, = 7 + Lx, 


通过 修正 获得 未 知 参数 的 无 偏 估 计 , 这 是 一 种 常用 的 方法 ,在 二 次 世界 大 
战 中 ,从 成 场 上 缴获 的 纳粹 德国 的 枪 文 上 都 有 一 个 编号 ,对 最 大 编号 作 一 修正 
便 获 得 了 德国 生产 能 力 的 无 俩 估计 。 


5.3.3 ” 极 大 似 然 估计 的 不 变 原则 

KA MIE BO RRA e CO) 的 极 大 似 然 估计 可 用 下 面 所 述 的 极 大 似 然 
估计 的 不 变 原则 , 它 的 证 明 这 里 省 略 了 。 

定理 5. 2. 1( 不 变 原则 ) ” 设 b 是 9 的 极 大 似 然 估计 ,g (0) 是 2 的 连续 函 
数 , 则 g(0) 的 极 大 似 然 佑 计 为 gÂ). 

例 5.3.5 设 某 元 件 失 效 时 间 服 从 参数 为 4 的 指数 分 布 ,其 密度 函数 为 

plasA) 一 eo o, 0 

和 未知 。 现 从 中 抽取 了 ?个 元 件 测 得 其 失效 时 间 为 = ,zs,… 2: OR A REH 
寿命 的 MLE, 
”人 解 : 先 求 4 的 MLE，。 

DD 与 出 似 然 函数 


LW = [[ x = we 
(2) 取 对 数 得 对 数 似 然 函 数 
D a 
DHD 对 4 求 导 得 似 然 方程 为 ， 


(4) 解 似 然 方 程 得 


经 验证 它 使 1(4) 达到 最 大 ,由 于 上 述 过 程 对 一 切 样本 观察 值 成 立 , 故 * 的 
MLE 是 
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A AAA A A A a «r. 


1 
X 
元 件 的 平均 寿命 即 为 的 期 望 值 , 在 指数 分 布 场合 ,有 EGO = ER 
4 的 函数 ,其 极 大 似 然 估计 可 用 不 变 原则 求 得 , 即 用 2 的 MLEX 代 入 便 得 EGO 


A 二 


的 MLE H E(X) = = -X ATX tE EO 的 矩 法 估计 , 故 卫 是 ECX) 的 
无 偏 相合 估计 。 


5.3.4 极 大 似 然 估 计 的 渐 近 正 态 性 


在 分 布 类 型 已 知 的 场合 , 极 大 似 然 估计 受 人 们 重视 的 原因 除了 上 面 
例 5. 3. 1 所 提 到 的 符合 人 们 的 经 验 外 ,还 由 于 极 大 似 然 佑 计 具 有 渐 近 正 态 性 ，。 
下 面 仅 就 单 参数 连续 分 布 的 场合 不 加 证 明 地 给 出 这 一 定理 。 

定理 5.3.2 


设 总 体 关 具有 和 密度 函数 p(xz;9) ,未 知 参数 9€ 8,9 是 一 个 
非 退 化 区 间 。 并 假定 


(1) 对 一 切 9 E 05 2 Zne DL e, 


< Fila), <a 
其 中 函数 Flr), Fox) 在 (一 00,00) 上 可 积 , 而 函数 Fix) 满足 


| Fs(z)plri0)dr < M 
其 中 M 与 人 无 关 。 


(3) 91 0 € 8@, 有 

,< veou<s 
则 在 分 布 参数 9 的 真 值 % 为 8 的 一 个 内 点 的 情况 下 ,其 似 然 方程 az 二 0 有 
-- 个 解 存在 ,并 对 任 给 = > 0, 随 着 z -= co, 有 PC8 一 be 一 0, 日 9 渐 
近 服 从 正 态 分 布 


ao, 


该 定理 对 单 参数 离散 分 布 场合 也 成 立 , 只 要 把 定理 中 的 密度 函数 p0) 
看 成 是 概率 函数 ,将 积分 改 为 求 和 即 可 。 
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例 5.3.6 EX Xt) Aa 是 来 目 N(x4,0°) 的 一 个 样本 ,可 以 验证 对 


(一 y 


e 


„ol 
porto) Jno 

在 o 已 知 时 或 在 w 已 知 时 均 满 足 定理 5. 2. 1 中 三 个 条 件 。 
Dio Eg, H MLE X p= XX MH EE 5. 2.1 知 A 渐 近 服 从 正 态 


dnp)? >) 
分 布 N| es [mE ng | ,由 于 
| _ 2 
Inp(z) 一 一 In /21 — Hno? — EA = 
dnp_ zp 
mM P 
,2 
E| mp) ES =2 
dp O O 


ATE A ERA N Gr om) X KOREA. 
(2) RE n Eo ly MLE X 0 LY) (A — 10? MUERE 5. 3- 24, 


2 渐 近 服从 N| o, nE 


El rá í — E| ZSE] 


20%. 


[ECX — wW) — 24E(X — a ++ o] 


从 而 o? 的 渐 近 分 布 为 No, 20n). 
极 大 似 然 佑 计 的 新 近 正 态 性 ,为 今后 在 大 样本 情况 下 讨论 参数 的 区 加 佑 
计 及 假设 检验 提供 了 依据 。 


$54 区 间 估 计 


参数 估计 有 两 种 形式 。 点 估计 值 能 给 人 们 一 个 明确 的 数量 ,未 知 参数 9 是 
多 少 , 但 不 能 给 出 精度 ,为 了 弥补 这 种 不 足 ,统计 学 家 又 提出 区 间 估 计 概 念 。 点 
估计 与 区 间 估 计 是 互 为 补充 .各 有 各 的 用 途 , 下 面 先 给 出 有 关 概 念 。 
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h A Ft HE ih- CP i E die rhs m A rer rar. -. - ` too. oree - 


5.4.1 区 间 估 计 的 概念 

定义 5.4.1 设 9 是 总 体 的 一 个 参数 ,其 参数 空间 为 O, Xi XXn 是 
来 自 该 总 体 的 一 个 样本 ,对 给 定 的 a(0 二 a 二 1), 确 定 两 个 统计 量 9 = 9.(X， 
Xart Xa) 与 Ou = XA XX o Xn) , 若 对 任意 09E€ 8, 有 

P(0,<O0<O)>1=4 , YEO (5.4.1) 
则 称 随机 区 间 [9i 001 Æ 0 MERA 1— “的 置信 区 间 RARO, 0o] Æ 
0 1— «HERRIA 0. 与 和 分 别称 为 1 一 <“ 的 置信 下 限 与 置信 上 限 . 

1] 一 a 置信 区 间 的 本 意 是 ;设法 构造 一 个 随机 区 间 [9, ,2 , 它 能 盖 住 未 知 
常数 9 的 概率 为 1 一 a。 这 个 区 间 会 随 着 样本 观察 值 的 不 同 而 不 同 ,但 100 次 运 
用 这 个 区 间 佑 计 , 约 有 1000 — a) 个 区 间 能 盖 住 0, 或 者 说 约 有 100(1 一 收 个 
区 间 含 有 0, 言 下 之 意 , 大 约 还 有 100a 个 区 间 不 含有 9。 如 图 5.4.1 上 一 条 竖 线 
表示 由 容量 为 4 的 一 个 样本 按 给 定 的 OLAS Art Xn) lA XXX Y) RE 
得 的 一 个 区 间 ,重复 使 用 100 次 ,得 100 个 这 种 区 间 。 在 (a) 中 ,100 个 区 间 有 51 
个 包含 真正 参数 0 = 50 000, 这 对 50% 置信 区 间 (a = 0.5) 来 说 是 一 个 合理 的 
偏离 。 在 (b) 中 ,100 个 区 间 有 90 个 包含 真实 参数 9 = 50 000, 这 与 90% 置信 
区 间 一 致 。 


(a) 50% 置 信 区 间 


10 20 30 40 50 60 70 80 90 100 
(b) 90% 置 信和 区 间 


5.41 对 从 yx 二 50 000,7 = 5 000 的 正 态 总 体 中 随机 取出 100 
个 容量 为 4 的 样本 计算 得 到 的 置信 区 间 
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5.4.2 WHEA 
构 造 未 知 参 数 9 的 置信 区 间 的 一 个 常用 方法 是 枢 轴 量 法 , 它 的 具体 步 又 
是 : 
(1) 从 9 的 一 个 点 估计 4 出 发 ,构造 9 与 9 的 一 个 孙 数 G(0,0) ,使 得 G 的 
分 布 (在 大 样本 场合 ,可 以 是 GG 的 渐 近 分 布 ) 是 已 知 的 ,而 且 与 89 无关, 通常 称 
这 种 函数 G0,9) 为 枢 轴 量 ， 
(2) 适当 选取 两 个 常数 c 与 4, 使 对 给 定 的 a 有 
Ple SGO, <dA)>1—a (5. 4. 2) 
这 里 的 概率 大 于 等 于 号 是 专门 为 离散 分 布 而 设置 的 , 当 G(0,0) 的 分 布 是 连续 
分 布 时 ,应 选 c 与 d 使 (5.4.2) 式 中 的 等 号 成 立 , 这 样 就 能 充足 地 使 用 置信 水 
平 1 一 a。 
(3) 利用 不 等 式 运算 ,将 不 等 式 c 记 G09,0) < d 进行 等 价 变形 ,使 得 最 后 
能 得 到 形 如 0, < 0< Qu HAEA., AA Ha 8, N [08u] 就 是 H 的 1 一 a 
信 区 间 。 因 为 这 时 有 
POL SOS 04) =P(C<GC00<dA)>1w— a 
上 述 三 步 中 ,关键 是 第 一 步 ,构造 枢 轴 量 GC0,0) .为 了 使 后 面 两 步 可 行 ,G 
的 分 布 不 能 含有 未 知 参 数 。 壁 如 标准 正 态 分 布 W(0,1) 、X’ 分 布 等 都 不 含 未 知 
参数 ,因此 在 构造 枢 轴 量 时 ,首先 要 尽量 使 其 分 布 为 上 述 一 些 分 布 . 第 二 步 是 
如 何 确定 c 与 ,在 G 的 分 布 为 单 峰 时 常用 如 下 两 种 方法 确定 、 
第 一 种 , 当 G 的 分 布 为 对 称 时 (如 标准 正 态 分 布 ) ,可取 a, 使 得 
P(-d<G<d)=P(G|<dD)=1— (5. 4. 3) 
这 时 < =— d,d Y G 的 分 布 的 1 一 a/2 分 位 数 ( 见 图 5. 4. 2(a) ) 。 


p(G) | 
G 的 密度 曲线 


(a) G 有 单 峰 对 称 分 布 (b) G 有 单 峰 非 对 称 分 布 
5.4.2 RE CG 的 区 间 [c,d] 的 确定 


第 二 种 , 当 G 的 分 布 为 非 对 称 时 (如 Xx 分布), 可 这 样 选取 c 与 了 ,使 得 
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P(G<C)=a/2) P(G<d)=1—0/2 (5.4.4) 

即 取 e 为 G. 的 分 布 的 a/2 AMB) d 为 G 的 分 布 的 1 一 a/2 分 位 数 ( 见 图 
5. 4.2(by))。 

这 样 得 到 的 党 信 区 间 称 为 等 尾 置 信 区 间 。 

例 5.4.1 设 一 个 物体 的 重量 jy 未 知 ,为 估计 其 重量 可 用 天 平 去 称 量 。 由 
于 称 量 是 有 误差 的 ,因而 所 得 称 量 结 果 是 一 个 随机 变量 ,通常 服从 正 态 分 布 ， 
当天 平 称 量 的 误差 标准 差 为 0.1 克 时 ,可 认为 称 量 结果 服从 Na, 0.10 。 现 对 
该 物体 称 了 五 次 ,结果 如 下 (单位 : 克 ): 
5.52 5.48 5.64 5.51 5.45 
可 将 其 看 成 来 自 该 总 体 的 一 个 容量 为 5 的 样本 的 观测 值 , 试 对 A 作 置信 水 平 
为 0.95 的 区 间 估 计 ， 

解 :(1) 由 于 /是 总 体 的 均值 ,通常 用 并 去 估计 它 。 在 正 态 总 体 场 合 , 和 一 


N| 1 E) ;这 里 7 = 5,0 = 0.1 均 为 已 知 , 从 而 
U = NOD (5. 4. 5) 
由 于 局 是 马 与 未 知 参数 w 的 函数 ,其 分 布 为 W(0,1) , 它 不 含 任何 未 知 参数 , 故 
可 将 U 作为 枢 轴 量 ， 
(2) 由 于 N(0,1) 是 对 称 的 连续 分 布 , 故 可 取 c = 一 4, 对 给 定 的 a, 要 求 
P(—d LU <d) = P((U| <d) =1—a 


由 标准 正 态 分 布 知 可 取 其 1 一 7 > 分 位 数 us EH d. 
(3) 从 IUlI Sda, mA TENE 可 解 得 


p|X — ua SAS X + 


o 
A V ai S 


从 而 w 的 置信 水 平 为 1 一 “的 置信 区 间 为 
X — us, X + — u.e 
| Gn X+- 1 (5. 4. 6) 
(4) 在 本 例 中 n= 二 5,o = 0.1, 在 a = 0. 05 Ho. 9o75 = 1. 96 ,由 样本 求 得 > 


= 5.52, 将 它们 代入 (5.4. 6) 式 可 得 w 的 置信 水 平 为 0. 95 的 一 个 具体 的 区 间 ; 
[5. 432,5. 608], 
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5.4.3 ” 正 态 均值 y 的 置信 区 则 (o 已 知 ) 

正 态 均值 x 的 置信 区 间 要 分 两 种 情况 来 讨论 :o 已 知 与 未 知 ,o 未知 的 情 
况 在 下 一 小 段 讨论 ， 

z 已 知 的 场合 已 在 例 5. 4. 1 中 作 了 讨论 ,在 那里 我 们 用 枢 轴 量 


X 一 
U==£-1N(0,1) 
II/ Y n 


给 出 的 置信 水 平 为 1 一 “的 置信 区 间 是 


— => g 
E o Es V 
此 种 关于 X 对 称 的 置信 区 间 也 可 记 作 
X++ U—> (5.4.7) 


n 


其 中 一 一 = 5(X) 是 及 的 标准 差 , 也 称 其 为 标准 误 . 这 样 一 来 ,在 so 已 知 场合 ， 


正 态 均 值 py 的 1 一 a 置信 区 间 是 以 样本 均值 下 为 中 心 


RE a fii 


为 半径 的 区 间 ,这 里 ue 是 标准 正 态 分 布 的 1 一 > 分 位 数 ， 

关于 总 体 均值 x 的 置信 区 间 还 有 两 个 问题 值得 讨论 。 

第 一 , 当 总 体 不 是 正 态 分 布 而 总 体 标准 差 已 知 ,那么 在 大 样本 场合 (n > 
30), 忆 体 均值 x 的 置信 区 间 仍 可 用 (5. 4. 7) 求 得 ,这 是 因为 在 大 样本 场合 , 样 


EEH X MEAM N pZ) ATZ E 近似 服从 标准 正太 分布 


例 5.4.2 对 50 名 大 学 生 的 午餐 费 进行 调查 ,得 样本 均值 为 3.10 元 , 假 
如 总 体 的 标准 差 为 1.75 元 , 试 求 总 体 均 值 ( 即 该 校 大 学 生 的 平均 午餐 费 )w 的 
0. 95 的 置信 区 间 。 | | 

解 : 由 于 样本 容量 较 大 ,因而 可 用 (5. 4. 7) AR SRK AE n = 50, 
o = 1. 75,7 = 3.10, 在 a = 0. 05 时 ,wo.ws = 1. 96,3 z KJ 0. 95 的 置信 区 间 为 


n O 1.75 
x + 1.96 —— = 3.10 + 1.96 x= = 3.10 + 0. 49 = 2.61,3.59]| - 
Vn | Y 50 L J 


第 二 ,样本 量 的 确定 。 

对 给 定 的 置信 水 平 , 置 信 区 间 的 长 度 越 短 , 则 估计 的 精度 就 越 高 . 

在 上 面 两 个 例子 中 ,对 给 定 的 置信 水 平 1 一 wx,w 的 置信 区 间 (5. 4.7) 的 长 
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度 为 


L == 2uj— a (5. 4. 8) 


¿Sn 
它 不 随 样本 观察 值 而 变化 ,在 a = 0.05 HF, L = 3.920/ VY n ,在 对 称 分 布 场 
E ,用 这 种 方法 求 得 的 置信 区 间 是 最 短 的 ,其 实 .的 置信 水 平 为 1 一 a 的 置信 
KEA UAE E MA P Cuo o SU S uos) = 0. 95 可 得 置信 水 平 为 0.95 的 
ERRE» 一 xzosee/ N n ,X — uouo / Mn ]; 此 时 置信 区 间 的 长 度 为 
L' 一 (uo — uoo)o/ Mn = (2.33 + 1.75)0/ ~ n =4.080/ Yn >L 

图 5. 4. 34H TIBIA F IRA A AA A K K RE, MU E 

可 见 , 当 c= 二 一 d 时 区 间 长 度 最 短 。 


(b) c=zoot=-1.75 2.33= U0.99=d 
图 5. 4.3 ”对 称 分 布下 cd 不 同 取 法 对 应 的 区 间 长 度 
对 给 定 的 a, 为 了 提高 区 间 估 计 的 精度 ,就 需要 减 小 区 间 估 计 的 平均 长 
度 . 当 oo 已 知 时 , 正 态 总 体 均值 py 的 1 一 a 置信 区 间 的 长 度 工 是 样本 容量 的 
e, BA. 4.8) 式 可 知 工 是 的 威 函数 ,因而 可 以 通过 增加 样本 容量 nn 来 
达到 所 高 精度 的 目的 ,和 链 如 给 定 精度 , 即 给 定 置 信 区 间 的 长 度 Lo BRA PR 
EJE | | 
L, = 2u,-20/ An 
从 中 解 出 


241-206 < 
a 
Bİ 5.4.3 在 例 5.4.1 中 ,为 使 & 的 置信 水 平 为 0.95 的 置信 区 间 长 度 书 
= 0.1, 求 样本 容量 n。 o 
解 : 由 于 现在 < 一 0.05, 故 zs 一 1.96, 又 5 一 0.1, 又 要 求 了 = 0.1, 故 
245 


n = 


(5.4.9) 


由 (5.4.9) 求 得 


__([2X1.96Xx0.1)/* 
o 0.1 


即 如 有 果 我 们 用 该 天 平 称 这 一 物体 16 次 , 则 求 得 的 ww 的 置信 水 平 为 0.95 的 置信 
区 间 长 度 不 会 超过 0. 1 。 


= 15. 3664 = 16 


5.4.4 ESHI y 的 置信 区 间 (o 未 知 ) 
ES 未知 时 , CG. 4.5 表示 的 UU 不 能 用 来 构造 u 的 置信 区 间 , 因 为 此 时 它 
还 含有 未 知 参 数 o, 一 个 自然 的 想法 是 用 样本 标准 差 5 去 估计 总 体 标 准 差 o， 


sE 就 不 再 服从 N(0,1) 分 布 ,而 涉及 分布. 下 面 先 介绍 二 下; 分布. 


5.4.4.1 13% 
+ 一 X 
~L Y /n 


的 分 布 称 为 自由 度 为 n 的 分布 , 记 为 i(n)。 | 
分 布 是 统计 中 常用 的 概率 分 布 之 一 , 它 仅 含 一 个 未 知 参数 ,这 个 参数 
称 为 自由 度 , 自 由 度 为 n 的 1 分布 的 密度 函数 有 如 下 形式 ， 
r 二 > 、_a 十 1 
Gi, _eo<cr<o 
VarT| E n 


2 
其 图 象 见 图 5. 4. 4。 


ptx)= 


5.4.4 ” 几 个 上 分 布 的 密度 函数 与 标准 正 态 密 度 函 数 
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从 图 5.4.4 可 见 ,i(n) 的 密度 函数 是 偶 函 数 , 它 是 关于 纵 灿 对 称 的 单 峰 函 
数 , 形 状 与 标准 正 态 分 布 相似 ,但 峰 比 N(0,1) 的 峰 低 一 些 , 两 侧 尾部 厚 一 些 ， 
这 表明 :分 布 的 取 值 的 分 散 程度 要 比 N(0,1) 大 一 些 。 随 着 自由 度 的 增 大 , 
分 布 与 N(0,1) 之 间 的 差别 就 越 来 越 小 ,从 图 5. 4. 4 可 见 , 自 由 度 为 10 的 z 分 
布 已 很 接近 (0,1) 了 。 自 由 度 为 1 的 :分 布 的 密度 函数 


1 
r +r) ? 
这 便 是 柯 西 分 布 ,其 数学 期 望 与 方差 均 不 存在 。 
目 由 度 为 n 的 1 分 布 的 pp 分 位 数 记 为 i,(n), 附 表 4 便 是 1 分布 的 单 侧 分 位 
5.4.4.2 50 未知 场合 , 正 态 均 值 w 的 1 一 a 置信 区 间 
前 面 已 提 到 在 c 未 知 场合 , 拟 采 用 枢 轴 量 


_ Xp - 
f = (5. 4.10) 
S/N n ? 


为 此 要 给 出 上 的 分 布 。 
定理 5.4.1 EX, DC De 是 来 目 N (u,a) 的 一 个 样本 ,XS 分 别 为 


上 | _X-p | n — 
样本 均值 与 样本 方差 , 则 : STi 服从 自由 度 为 ”一 1 的 分 布 ， 


证 :由 第 四 章 $ 4. 2 40:X 5 S? 独立 , 且 


2? X 
Ap 一 Ta (0,1) 
(n — DS? 


(2) P ~ X(n — 1) 
那么 由 定义 5. 4.2 知 


有 了 上 述 定理 , 便 可 由 杠 轴 量 (5.4. 10) 及 上 分 布 的 分 位 数 来 求 w 的 1 一 a 
的 置信 区 间 了 .。 由 于 : 分布 是 对 称 的 , 故 求 等 尾 的 置信 区 间 ,由 
P(l£] St-a —1))=1—a 
可 得 p 的 置信 水 平 为 1 一 “的 等 尾 的 置信 区 间 ( 见 图 5. 4.5) 为 
S 


n 


X + t$ 


(5. 4.11) 
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At, 2(n) tg(n) 


图 5. 4.5 i 分布 的 分 位 数 


M n BEKES RI n > 30,t 分 布 可 用 NC0,1) 代替 ,分 布 的 分 位 数 可 用 
N (0,1) 的 分 位 数 代替 ,这 时 的 1 一 a 置信 区 间 为 


X 十 Wl1—3 


-天 (5. 4. 12) 
例 5.4.4 某 行业 职工 的 月 收入 服从 NCp,0), 现 随机 抽取 30 名 职工 进 
行 调查 , 求 得 他 们 的 月 收入 的 平均 值 = 696. 20 元 ,标准 差 ; = 136.10 元 , 试 
K 4 的 置信 水 平 为 0. 95 的 置信 区 间 。 
解 : 由 于 o 未 知 , 故 用 (5. 4. 11) 式 来 求 w 的 置信 区 间 。 现 在 ”= 30, 在 a = 


0. 05 时 查 附 表 4 得 如 ss(29) = 2.0452, X Z = 696. 20,5 = 136.10, 将 它们 代 


入 (5. 4.11) 得 : 
136. 10 
696.20 + 2.0452 X 一 二 = 696.20 + 50. 82 = [645. 38,747. 02] 
~ 30 


故 该 行业 职工 的 月 平均 收入 在 645. 38 元 到 747.02 元 之 间 。 


5.45 ESJZ SEE 的 置信 区 间 

设 从 正太 总 体 N (0) 中 获得 样本 XX Xn WEIEN XX FEAR 
TES ,这 里 假定 AM. 

为 求 的 置信 区 间 , 我 们 从 其 估计 S 出 发 ,在 $4.2 已 证 明了 
2 _ no DS” 

k o? 

Xx” 中队。 外 不 含 其 它 未 知 参数 ,其 分 布 已 知 , 且 与 a 无 关 , 因 而 可 将 (5. 4. 13) 
FARM. ET O 只 能 取 非 负 值 , 且 分 布 不 对 称 ,因而 按 (5. 4. 4) ,对 给 定 的 


,从 附 表 5 的 * 分 布 表 中 查 得 与 1 一 两 个 分 位 数 驹 bn DA 
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~ X(n — 1) (5.4.13) 


一 1)( 见 图 5. 4.6), 则 有 
P(X% a DSRS Xip a— D)=1—a 


Y mia 


x g (22) A rg (n) 


5.4.6 XX 分 布 的 分 位 数 


从 
2 
La D < TPE S gl 1D (5. 4. 14) 


ARI 0 的 置信 水 平 为 1 一 a 的 置信 有 区 间 是 
(n 一 1)S° (n — 1)S° 
| Xi-4 (n — 1) Xs (n 一 1) | 
由 于 在 (0,ce) 上 ao 是 有 世 的 严格 增 函 数 , 如 果 将 (5. 4. 14) 不 等 式 各 边 均 开 
方 , 则 所 得 新 事件 


Xs (n—1)< ALE E ln — 1) (5.4.16) 


5 (5. 4.14) 为 等 价 事件 , 即 仍 有 


P| Xs (2 一 D <S A 1S <A AD) = 18 
BA C5. 4.16) 可 得 cc 的 1 一 EI 
~n — lS Yn— lS 
yx (n — 1) y% — 1) 


例 5.4.5 求 例 5.4.4 中 的 置信 水 平 为 0. 90 的 置信 区 间 。 
解 : 由 于 这 里 y 未知, 因而 用 (5. 4.17) 作为 c 的 置信 区 闻 .。 现 在 2 = 30,4 
= 0. 10, 由 附 表 5 碍 得 好 o(29) = 17. 708 , X. os (29) = 42. 557, X s = 136. 10, 
将 它们 代入 (5.4.17) 得 的 置信 水 平 为 0. 90 的 置信 区 间 为 
[22 x 136.10 M29 x 136.10 


(5.4.15) 


(5.4. 17) 


-= [112.35, 174.17] 
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故 该 行业 职工 月 平均 收入 的 标准 差 在 112. 35 元 ~ 174.17 元 之 间 。 


5.46 ”两 个 正 态 均值 差 的 置信 区 间 

设 有 两 个 独立 正 态 总 体 , 关 ~ 和 NG,01),Y ~ N Ca) WM X PIRI 
本 XX XX ,其 样本 均值 为 下 ,样本 无 偏方 差 为 S%, 从 YY 中 获得 样本 YY,， 
Y;，… ,了 ,其 样本 均值 为 了 ,样本 无 偏方 差 为 SWERK a 一 yz 的 置信 区 间 。 
这 是 著名 的 Behrens 一 Fisher 问题 , 几 种 特殊 情况 已 获 圆满 解决 ,一般 情 况 至 
今 也 只 有 近似 解法 ,以 下 分 别 叙 述 。 | 

(Do, 5 os 已 知 的 场合 。 

此 时 可 用 X — Y 25H 4 一 pj, 由 正 态 分 布 性 质 可 知 信 一 了 ~N (pn 一 


of | % 
Mar + 2) AM 
_ (X — Y) 一 (44 — M2) 


由 于 U 中 除 FI ”az 外 不 含 其 它 未 知 参 数 , 其 分 布 已 知 , 且 与 FI — Pa AR, A 
而 可 将 愉 作 为 枢 轴 量 , 同 例 5.4. 1 的 推导 ,m 一 Am 的 置信 水 平 为 1 一 “的 置信 
区 间 是 


o; 


X—Y + uis A + 
(2) 已 知 o = 0, 但 具体 值 未 知 的 场合 。 


由 于 假定 m = 04, 可 将 其 记 为 o, 那 么 SX 与 59 都 是 同一 方差 0 的 无 偏 估 
计 , 则 其 加 权 平 均 


(5. 4. 19) 


= (n— 1DSí + (m — DS? 
o n+m-—2 


EA o 的 无 候 佑 计 。 下 面 的 定理 将 告诉 我 们 如 何 从 Sw 构造 枢 轴 量 。 

定理 5.4.2 设 X1 D CP An 是 来 目 正 态 总 体 X 一 NC ,0°) 的 一 个 样 
本 ,Yi1,Y,,… Yn 是 来 日 正 态 总 体 Y ~ N, 的 一 个 样本 , 且 两 样本 独立 ， 
两 个 样本 的 均值 分 别 记 为 XA Y ,两 个 样本 的 方差 分 别 记 为 S% 5 Sé, Mm 
| _X—Y— (mz) 

Sw 一 十 过 
这 里 Sh 如 (5. 4. 20) 式 所 示 。 
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Si (5. 4.20) 


t — tn + m — 2) (5. 4. 21) 


证 :由 $4.2 知 


2 — 08? 
G DSX Yan 1), Gn 1) Y 


5 o 
且 两 者 独立 ,由 X? 分 布 的 可 加 性 知 
—1)87 oc 
(n 一 DS; ym DS _(n tm OW 20 +m=2) 


O O O 


另 一 方面 由 两 样本 独立 性 知 


~ Y (m — 1) 


1 ] 
X-Y~N|n- u + Hol 
Bp 
X — Y — a =) .Neo,]) 
o [11 
n m 


再 由 样本 均值 与 样本 方差 的 独立 性 知 X 一 了 与 S 和 也 相互 独立 ,从 而 由 定义 
5. 4. 2 知 
X — Y — (41 — p) 
daj — + > 7 本 
-一 一 m > EL m) npm?) 
AR m 2) Sy 一 十 这 

这 里 Sw _ si. 

由 于 (5. 4. 21) 的 分 布 是 自由 度 为 n 十 mr 一 2 的 分布, 故 可 用 此 枢 轴 量 i， 
经 过 类 似 (5. 4.11) 的 推导 ,得 mm 一 Am 的 置信 水 平 为 1 一 a 的 置信 区 间 是 


X—Y tent m— 2)SwA/lL + t (5. 4. 22) 


(3) H n E m 痢 充分 大 时 ,可 以 证 明 
T _X-—Y— (m 12) 
SiS 


d: m 


的 渐 近 分 布 为 W(0,i), 从 而 此 时 Am 一 2 的 1 一 a 的 置信 区 间 为 


>= G JSx Sp 
X — Y hu-2 SS (5.4. 24) 


(4) 一 般 场 侣 , (5.4. 23) 中 的 枢 轴 量 了 已 不 是 N00,1), 而 是 近似 于 自由 
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(5. 4. 23) 


度 为 ! 的 上 分布 ,其 中 


l= - > (5. 4.25) 
SX 十 SY 
n(n — 1) m“ (m — 1) 


当 /不 为 整数 时 ,可 取 与 / 最 接近 的 整数 代替 .于 是 在 一 般 场合 ,近似 地 有 枢 轴 
ET ¿iD ,运用 上 述 类 似 的 步骤 ,可 得 mm 一 pi 的 1 一 a 和 置信 区 则 近似 为 


2 2 
Xin WM E (5. 4. 26) 


例 5. 4.6 某 厂 用 两 条 流水 线 生产 著 疙 桨 小 包装 , 现 从 两 条 流水 线 上 各 
随机 抽取 一 个 样本 ,容量 分 别 为 n 二 6,m 二 7, 称 重 后 算得 (单位 ; 克 )， 
z= 10.6, $ = 0.0125 
y= 10.1, s = 0. 01 
设 两 条 流水 线 上 所 装着 趟 痪 的 重量 天 与 了 都 服从 正 态 分 布 , 其 均值 分 别 为 yx 
与 pr ,方差 分 别 为 0% G 0%, K px 一 py 的 置信 水 平 为 0. 90 的 置信 区 间 。 
解 : 先 设 X 与 了 的 方 益 相 等 ,这 时 可 用 (5.4. 220 求 px 一 yy 的 置信 区 间 。 
HF «=0.10,.n 十 和 一 2 一 11, 由 上 分 布 表 查 得 和 ws(11) = 1.7959, XAK 
得 o | 
元 一 了 一 0.5 


sy 一 nao = 0.01114, sw = 0. 1055 


将 它们 代入 (5. 4. 22) 得 jxx 一 pr 的 置信 水 平 为 0. 90 的 置信 区 间 为 


T —F+tw(1Dsw E + L = 0.5 1.7959 x 0.1055 Xa+ + L 


= 0.5 + 0. 1054 = [0. 3946,0. 6054] 


如 果 认 为 站 与 Y 的 方差 不 等 , 则 应 该 用 (5. 4. 26) R yx 一 py 的 置信 区 间 。 
此 时 


sx | SF 0.0125 0.01 | 

- +a 6 Ho = 0. 003512 
2 

= 0.003512 L 10.21 œŒ 10 


~ 0. 0125? 0. 01? 

6: X 5 72 X 6 

由 a= 0. 10, 查 得 to0.95(10) = 1. 8125, 故 
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2 2 | 
£05 (10) A/ 二 十 x — 1.8125 X ~/0. 003512 = 0. 1074 


代入 (5. 4.26) 则 得 px 一 uy 的 置信 水 平 为 0. 90 的 置信 区 间 是 ， 
0.5 + 0.1074 = [0. 3926,0. 6074 ] 
两 种 方法 求 得 的 区 间 略 有 老 并 。 


547 ”两 个 正 态 方差 比 的 直 信 区 问 
在 上 一 小 段 的 假定 下 ,寻求 两 个 正 态 方差 比 的 置信 区 间 将 涉及 到 下 分 布 ， 
下 面 先 对 下 分 布 作 一 介绍 。 | 


(1)F 分 布 。 

定义 5.4.3 WME X~ Lln), Y ~ Lm), HX 5Y, 
_ X/n 
= Y/m 


的 分 布 称 为 自由 度 是 4 与 m 的 下 分 布 , 记 为 F(n,m)， 
分 布 是 统计 中 常用 的 概率 分 布 之 一 , 它 仅 在 (0,co) ERUR F 分布 的 概 
率 密度 函数 为 


2 


p(x) 


0.0 1.0 2.0 3.0 40 x 
图 $.4.7 几 种 下 分 布 密度 曲线 
所 分 布 含 两 个 参数 :分 子 的 自由 度 , 分 母 的 自由 度 m。. 从 图 5.4.7 可见 FF 
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分 布 是 一 种 候 态 分 布 。 

自由 度 为 n,m 的 分 布 的 pp 分 位 数 记 为 n,m), 附 表 6 中 给 出 了 p= 

0. 50,0.90,0. 95,0. 975,0. 99,0. 995,0. 999 共 七 个 值 的 分 位 数 , 那 么 当 p 一 

0. 50 时 分 位 数 该 怎么 求 呢 ?这 要 用 到 下 面 一 个 性 质 . 

PTS (5. 4. 27) 
1—p\M y 


F,(nym) 一 


IAF mn) 是 下 的 Zz 分 位 数 , 则 由 分 位 数 性 质 可 知 ， 
PCF <F,(n,m))=p 
Bp 


1 


1、 1 | 
a > am =? 


从 而 
1 1 
PES Fam, =1>P 
1 1 y 
这 表明 天 a,m) 是 天 的 1 一 记分 位 数 , 即 


E 呈 汪汪 时 时 
Fnm) Fi-p m,n) 


故 有 (5.4. 27) R. 

(2) 两 个 正 态 方差 比 的 置信 区 间 。 

EX Xa X, EX HIERE X ~ NC, ,0í) 的 样本 Yi ya 是 
来 自 正 态 总 体 Y ~ NC) 的 样本 , 且 两 个 样本 独立 ,为 求 0/0 的 置信 区 


间 , 很 自然 想到 用 它们 的 估计 之 比 作 枢 轴 量 , 设 S 与 5 分 别 为 两 个 样本 的 方 
差 , 记 


F = So (5. 4. 28) 


为 要 使 下 能 作为 枢 轴 量 , 就 需要 知道 其 分 布 . 对 此 有 下 面 的 定理 。 
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定理 5.4.3 Y Xy DE 900.” e 是 来 目 NU ,01 ) 的 一 个 样本 Y y Y, >» 

Y 是 来 自 N (yp,02) 的 一 个 样本 , 且 两 样本 独立 ,两 样本 的 方差 分 别 记 为 54 与 
y W 

Sx/07 


F 一 


证 :由 $4.2 知 
2 — 2 
DS ya — 1), m D yim — 1) 


O; 05 

由 两 样本 的 独立 性 知 5% 与 5$ 独立 ,再 由 下 分 布 的 定义 知 
(n — 1)S% 

a AD sg 

Gn — DST Sila 


9 (m 1) 
ATG: 4. 28) 中 的 一 (x 一 1,m 一 1), 就 可 以 把 F 看 作 枢 轴 量 ,由 此 
可 获得 一 的 1 一 a 的 等 属 置信 区 间 


S$, I SE. 
Sp Fi<(n=1m=1* Si Fe(n— 1,m — 1) 


~ Fín— 1,m — 1) 


| (5. 4. 29) 


类 似 (5.4. 27) 的 导出 ,还 可 得 正 态 总 体 标准 差 之 比 好 的 1 一 “置信 区 间 

为 
Sx | Dx . 

STO CERES Sy NVF (1 — 1,m — 1) ren] (5. 4. 30) 

例 5.4.7 求 例 5.4.6 中 ox/oy 的 置信 水 平 为 0.90 的 置信 区 间 ， 

解 :在 a = 0.10,n = 6,m = 7 时 , 查 玉 分 布 表 得 

Fog (5,6) = 4. 39 

H (5. 4.27) 又 得 


a l1 ç _ 1l 
Foos (5+6) = Fo9(6,5) . 95 


将 si = 0. 0125,5 = 0.01 及 上 述 分 位 数 都 代入 (5. 4. 30) 式 , 得 ox/o7 的 置信 
水 平 为 0. 90 的 置信 区 间 是 


ESTE 0125 1] _ 0.0125 JESE 


, TO. 5336,2. 4875 
0.01 VA. 39 ~/ 0. 01 |- i 
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这 表明 两 条 蕃茄 桨 小 包装 流水 线 包 装 重 量 的 标准 差 之 比 在 0.5336 一 
2. 4875 之 团 。 


$55 SUS 


5.5.1 单 侧 置信 限 的 概念 

在 一 些 实际 问题 中 ,我 们 往往 关心 某 些 未 知 参数 的 上 限 或 下 限 .例如 对 某 
种 合金 钢 的 强度 来 讲 , 人 们 总 希望 其 强度 越 大 越 好 ,这 时 强度 的 “下 限 ” 是 一 
个 很 重要 的 指标 ,而 对 某 种 药物 的 毒性 来 讲 , 人 们 总 希望 其 毒性 越 小 越 好 ,这 
时 药物 毒性 的 “上 限 ” 便 成 了 一 个 重要 的 指标 ,这 些 问 题 都 可 以 归结 为 寻求 未 
知 参 数 的 单 侧 置 信和 限 问题 ，。 / 

定义 5.5.1 设 9 是 总 体 的 某 一 未 知 参数 ,对 给 定 的 a(0 < “< 1), 由 来 
E 该 总 体 的 样本 XA: DEF ... ¡An ME ATTE O, 一 QL(X) ».E 9 , An) ,满足 

PO Z0) =>1—a (5.5.1) 
则 称 9 为 置信 水 平 是 1 一 “的 单 侧 置 信 下 限 ,简称 1 一 a 置信 下 限 ,又 若 由 样 
本 确定 的 统计 量 Oo = 名 (XXX) ,满足 
P(0<0)=1-—a (5.5.2) 

则 称 多 为 置信 水 平 是 1 一 a 的 单 侧 置信 上 限 ,简称 1 一 a 置信 上 限 。 

所 有 用 来 求 置 信 区 间 的 枢 轴 量 都 可 以 用 来 求 单 侧 置信 限 ,下 面 举 两 个 例 
子 说 明 。 

例 5.5.1 为 研究 某 种 汽车 轮胎 的 磨损 特性 ,随机 取 16 只 轮胎 实际 使 
用 . 记 孙 其 用 到 麻 坏 时 所 行驶 路 程 ( 单 位 :公里 ), 算 得 未 = 41 116,s = 6 346。 
奉 设 此 样本 来 自 正 态 总 体 Nuw,a2) ,如 今 在 吧 未 知情 况 下 ,要求 该 种 轮胎 平均 
行驶 路 程 u 的 0. 95 置信 下 限 。 

解 : 由 于 该 正 态 总 体 中 0 未知 ,因而 用 $ 5.4 中 (5.4. 10) 式 作 枢 轴 量 ， 此 
Bf X—u ~ t(n — 1), 


SIS nm 
由 上 分布 知 ,对 给 定 的 ,可 找到 二-, (2 一 1), 使 得 
Xp 
| POSTS an — 1) l=1—a 
由 此 可 推 得 
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A -， -一 -一 一 mes o — = 


A >X — ne 一 1) 


故 w 的 置信 水 平 为 1 一 “的 置信 下 限 是 
p=X— -一 一 1) 

在 本 例 中 ,n = 16,a = 0. 05 24% £0.95(15) = 1.7531, FH TA s WER 
入 ,得 .的 置信 水 平 为 0.95 的 置信 下 限 是 38 334 公里 。 

例 5.5.2 用 仪 锋 间接 测量 炉子 的 温度 ,其 测量 值 服从 正 态 分 布 N (Am 
o), EH py IJRA ,这 里 我 们 关心 的 是 cc 的 上 跟 。 现 用 该 仪 夯 重复 测 5 次 , 结 
RACC): 

1250 1265 1245 1260 1275 

AR o 的 置信 水 平 为 0. 95 ERER. | 

解 :由 于 AAA ARES 5.4 中 (5.4.13) 式 作 为 枢 轴 量 ,此 时 x? = 
ape ~ X(n — 1). 

由 于 要 求 0,, 使 Plo 过 00) >1— XA FNMTFER PoS) 过 1 一 wa， 
亦 即 要 求 


2 
p (n A JS 


之 cj 一 1 一 a 
E ERRA = (rn 一 1), 从 而 of 的 置信 水 平 为 1 一 a 的 置信 上 限 
oz = (n — 1)5* 
Xin — 1) 
Mo 的 置信 水 平 为 1 一 a 的 置信 上 限 为 
Vn 一 DS 
N X(n — 1) 
在 本 例 中 ,n = 5,a = 0. 05 Hf, Xo (4) 二 0.711, 由 样本 可 求 得 ; = 11.9, 
将 它们 一 起 代入 ,得 o 的 置信 水 平 为 0. 95 的 置信 上 限 为 28. 2， 
下 面 我 们 将 介绍 构造 单 侧 置信 限 的 一 般 方法 ,并 按 分 布 函数 为 连续 函数 
与 阶梯 函数 分 别 讨论 ， 


dr = 


5.52 ”基于 连续 分 布 函 数 构造 置信 限 
设 F(x;9) 是 连续 随机 变量 X 的 分 布 函数 ,其 中 0 是 所 含 未 知 参数 , 则 有 
F(X;0 =UO,D FED IE CO, DO) PEER Sr A 
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P(F(X¡O<r)=r , 0<r<l 
下 面 我 们 利用 这 一 性 质 来 构造 9 的 置信 限 ， | 
设 9 = 0(X) 是 9 的 一 个 估计 (如 极 大 似 然 估计 , 秆 法 估计 等 ), 又 设 Gly; 
0) 是 9 的 分 布 函 数 。 由 于 总 体 分布 是 连续 的 , 故 8 的 分 布 函数 也 是 连续 的 ,有 旦 
G(0;0) ~ UC0,1), 那 么 对 介 于 0 与 1 之 间 的 任意 实数 r+, 有 
PG; D <r) =r (5.5.3) 
现 假定 C(0;2) 是 2 的 严 减 函数 ,为 求 2 的 1 一 “的 单 侧 置信 下 限 ,可 令 (5. 5. 3) 
中 r= 二 1 一 a, 则 从 方程 
G(0;0) =1— a 
中 解 出 0 = 9.(X), 从 而 事件 “G0(0;9) < 1 一 a” 等 价 于 事件 “9 S 9.( 对 )”, 即 
P(0=>0,(X) =1—a 
AR OL 是 2 的 置信 水 平 为 1 一 <“ 的 单 侧 置信 下 限 ( 见 图 5. 5. 1)。 为 求 2 的 
1 一 a 的 单 侧 置 信 上 限 , 可 令 (5.5.3) Hr = a, 则 从 方程 
G(9;0) =a | 
中 解 出 9 = 9u(X), 从 而 事件 “G(0;0) < a” 等 价 于 事件 “9 > GO”, EN 
POLO(X))))—1—a . 
这 表明 9u(X) 是 9 的 置信 水 平 为 1 一 a 的 单 侧 置 信 上 限 ( 见 图 5. 5. 2) 。 


G(0.:0) G(O.0) 


O : O 
O, O, 
5.5.1 G(0;0) 是 9 的 单调 降 函 5.5.2 CC0) 是 9 的 单调 降 函 
21.3 0671 — «TIE FR 0, 数 , 求 9 的 1 一 a 置信 上 限 0, 


利用 这 一 方法 也 可 构造 9 的 1 一 a 置信 区 间 , 这 时 可 分 别 找 出 1 一 的 
置信 下 限 和 与 1 一 。 的 置信 上 限 ,使 


P(0>0,) = 1 一 > 
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P0>0)=1== 


从 而 


P(0,<0< 04) =1 —a 
EPCL, 0v] 是 2 的 1 一 “的 置信 区 间 ( 见 图 5. 5. 3). 
G(0:0) 


5.5.3 G(0;9) 是 0 的 单调 降 函 数 ， 
求 0 的 1 一 = 置信 区 间 L0 ,0 


当 GO 是 2 的 严 增 函数 时 ,也 可 类 似 处 理 。 
例 S. 5. 3 设 XiXe, XA, 是 来 目 正 态 总 体 N (1,07) 的 一 个 样本 ， 其 中 


EAN Go E) i AX FARBA O 2 ZE] .此 分 布 函数 是 元 
的 连续 函数 ,又 是 4 的 严 碱 函数 , 则 kK 的 1 — “置信 下 限 入 是 下 列 方程 的 解 ， 


7 — y 
a+ el 210 
若 令 ui-s。 是 和 N(0,1) 的 1 一 a 分 位 数 , 则 由 
ZE 
Faf N n s 
可 解 得 
— Oo 
人 


这 与 用 枢 轴 量 法 的 结果 一 致 。 
例 $5. 5.4 EXA X, 是 来 自 密度 函数 


p(20) == ,0 二 0 过 rio 
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的 一 个 样本 , 试 求 2 的 1 一 “置信 区 间 。 
解 :(1) 先 求 8 的 极 大 似 然 估计 
似 然 函数 


L() = gil Lje ， Yn ð 
i=] r 


EF LO) E ORERE O Xoa, 故 4 的 极 大 似 然 估 计 
ô = Xo 


(2) 求 9 的 密度 函数 gy0). 
由 plr) 一 E 0 <09 <z co 知 总 体 的 分 布 函数 
O, a<0a 
E Ca) -| ， ， T20 
TE 
EH0>0, AM ê = Xa HERRA 
gr(y;b) = np — FOT = ae, , 0<0< y<oo 
其 分 布 函数 


Gly; = 1 一 ， OLOS yoo 


Me ls 


(3) HTFC(X 00 =1 — 


Cr 
G(Xa30,) 一 1 一 ox = 1] — a/2 
(1) 


与 
o 
Ša 2 


中 解 出 O, — 2 xsl 一 AJ 1— 了 和 ao 所 以 0 的 1—ae 的 置信 区 间 是 
xe, i- EX! 


5.5.3 基于 阶梯 分 布 函数 构造 置信 限 
我 们 知道 ,离散 随机 变量 环 的 分 布 函数 下 (zj2) 是 阶梯 永 数 ,对 此 种 函数 
有 如 下 人 性质 : 
定理 5.5.1 EFG 是 随机 变量 X HITA, MR O <"r< 1, 
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GlX ua 50)=1— 


PIFOO <P <rT<pF(X-—0))=<r) 
其 中 F(z — 0) 是 F(z) 在 z 处 的 左 极限 ( 见 图 5.5.4). 
F(x) F(x) 


图 5. 5.4 阶梯 函数 的 左 极限 


这 个 定理 的 证 明 这 里 就 省 略 了 ,不 过 要 指出 的 是 ,当下 (zc) 为 连续 时 等 号 
RL ,并 有 F(x) ~U(0,1), 因 市 这 一 定理 是 上 节 所 用 性 质 的 一 种 推广 。 

利用 这 个 定理 可 以 构造 参数 的 单 侧 置信 和 限 , 设 XXX 是 取 自 总 体 
分 布 函数 FG 的 一 个 样本 ,其 中 参数 9 € @。 又 设 = AX XXn) 是 
9 的 某 个 估计 量 , 它 的 分 布 函 数 记 G(y;0) ,其 中 y 是 9 的 取 值 ,假如 用 9 去 代替 
yU G(9,0) 是 一 个 新 的 随机 变量 .由 定理 5. 5. 1 右边 不 等 式 可 知 

PIGOÓ—00<1—W0D>1—a 
另 一 方面 ,人知 设 C 还 是 0 的 连续 的 严 减 函数 , 令 久 是 关于 0 的 方程 CG(O 一 040) 
== 1 一 a 的 解 , 即 G(0 一 0;0/) = 1 一 a( 见 图 5.5.5(a)), 这 时 事件 “GC6 一 0; 
0) <1— a” 与 事件 “9 之 0” 等 价 , 于 是 有 | 
P(0>0,) =P(G(É— 00 <1—MH>1—e 
这 表明 9 是 9 的 1 一 a 单 侧 下 置信 限 。 


G(9-0:0) | G(6:0) 


O, O 
(a) G(9-0; 9,)=1-a (b) G(6:0)=a 


图 5.5.5 G 是 9 的 连续 严 碱 函 数 
类 似 地 ,由 定理 5. 5. 1 左边 的 不 等 式 可 知 


261 


P(G;0) Sa) SaN P(G(0,0) >a) >1>— 
在 G 是 2 的 连续 严 减 函数 假设 下 , 令 bo 是 关于 0 MARE GO; 0) 一 “的 解 , 即 
G(0;84) = a, M1 “0 < 0,” E*G(0,0) > ea” 是 两 个 等 价 事件 ,于 是 有 
P(0< 04) = P(G(0;0>%=>1—a 
这 表明 : 负 w 是 9 的 1 一 a 单 人 出 上 置信 和 限 。 
综合 上 述 , 我 们 证 明了 如 下 定理 。 / 
定理 $5.5.2 B XiX: Xn, EXA AA Fx 50) 的 一 个 样本 ,2 的 某 一 
估计 量 & 的 分 布 函数 为 G(y3;0) .假如 G(y;0) 还 是 0 的 连续 的 严 减 函数 , 且 
0 是 关于 9 的 方程 G0(0 一 050) = 二 1 一 的 解 (5. 5. 4) 
bu 是 关于 9 的 方程 G00;0) = a 的 解 
则 9 是 9 的 1 一 a 单 侧 置信 下 限 ,是 9 的 1 一 a 单 侧 置信 上 限 。 
当 G(b0) 是 9 的 严 增 函 数 时 ,可 类 似 证 明 如 下 定理 。 
定理 5.5.3 设 X,,X,,…,X, 是 来 自 总 体 F(z;0) 的 一 个 样本 ,0 的 某 个 
估计 量 9 的 分 布 函数 为 GC(y;0) ,假如 G(y;0) 还 是 9 的 连续 的 严 增 函 数 ( 见 图 
5. 5.6(a) 5 (b), HH 
入 是 关于 2 的 方程 G(O 一 050) = a 的 解 (5. 5. 5) 
bu 是 关于 0 的 方程 G(8;0) = 1 一 a 的 解 
则 9 是 9 的 1 一 a 单 侧 下 置信 限 ,9 是 9 的 1 一 a 单 人 出 上 置信 和 限 。 


G (ĝ-0:0) 


g, 6 
(a) G(0-0;0.)=a (b) G(0;0)=1-a 


图 5. 5.6 G 是 0 的 连续 严 增 函数 


下 面 我 们 通过 求 泊 松 分 布置 信 限 来 说 明 这 一 方法 的 具体 步 又 。 
例 5.5.8 设 Xy Agro” ¿An EX A] P(A) 的 一 个 样本 , 试 构造 4 
的 1 一 “置信 区 间 。 


解 :为 求 4 的 置信 区 间 ,可 分 两 步 进行 : 先 求 \ 的 1 一 -> 的 置信 下 限 ,再 
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求 4 的 1 一 5 的 置信 上 限 如 ,最 后 综合 即 得 : 
PA, <AS< A) =1—a 
由 于 4 是 泊 松 分 布 的 均值 ,因而 它 常用 样本 均值 作 估计 , 即 
so 15 x 


若 记 了 一 DX MTA T 的 分 布 出 发 进行 讨论 ,下 分 几 步 ， 
GD RIE X ~ PO) ,样本 X, Xor, X, 是 独立 同 分 布 的 随机 变量 , 故 
T 一 NX, ZP),  A=nA 
T 的 分 布 函数 为 
| GOA) = >, e A) y>0 
若 记 一 DJO 的 整数 部 分 ), 则 有 
GOA) = 3 A p-a 
当 y 为 正 整数 时 ， | 
Gly — 054) = y en 


(2) CA) Ea HERRBES. 
利用 分 部 积分 法 可 以 证 明 
l 一 Gly¡A,) = Y， Aa, 


i=k+1 z 


— FEFD f teras ，  A>0 (5. 5. 6) 
当 y 固 定时 ,k 也 随 之 固定 ,这 时 (5. 5. 6) 的 右 端 可 以 看 成 是 形状 参数 为 十 1， 
尺度 参数 为 1 的 伽 玛 分 布 的 分 布 函数 ,从 而 1 一 G(yih) 是 为 的 连续 的 严 增 函 
数 , 由 此 即 知 泊 松 分 布 的 分 布 函数 G OAD 是 为 的 连续 的 严 减 函数 ， 


(3) 由 定理 5. 2.2 可 知 4 的 1 一 所 置信 下 限 应 满足 
cty — O;nà) = 1 — 7 
即 


k~] ， 
(RAL) A l 


mo Él < 
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y (nA, ) eT" — CS (5.5.7) 


G(y;¿nAy) = > 
Rp 
5 àu) này — a 
o É! 2 
或 
(này) a a 
E t! 1 一 了 (5. 5. 8) 
| 1 +1 
O A -àa — | Ay 
=+] £1 =- r(k+1) | we 2du (5, 5. 9) 


这 是 和 目 由 度 为 zz=2( 十 1) 的 入 分 布 函 数 在 2n4 处 的 函数 值 , 记 为 
aaron (2n4), 
利用 这 一 性 质 , 那 么 (5.5.7) 与 (5. 5. 8) 可 改写 为 


Ros (2nAL) = p 


karo (2nAy) = 1 — y 
EX AA BEA $ 

2nA, = Xs (2k) 

2ndy = 1-2 (2(k 十 1)) 
从 而 得 


À = zX% (2k) (5.5. 10) 
n 2 


w = 10H 1) (5. 5. 11) 
MEREKA Aw] 就 是 泊 松 分 布 参数 4 的 1 一 “的 等 尾 置 信 区 间 。 
例 5.5.6 某 公司 一 天 内 帐 务 上 的 错误 个 数 服从 当 松 分 布 ,其 参数 A 未 
知 , 现 随机 抽查 10 K. HERA 6 个 错误 , 试 求 1 的 0. 95 的 置信 区 间 。 
解 :这 里 nn = 10,k = 6,2k = 12,2(k +1) = 14,40 = 0. 05 时, 查 X: 分 
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布 表 得 : 
X? ozs (12) = 4.404, Xó.ors(14) 一 26.119 
将 它们 代入 (5. 5. 10) 与 (5. 5. 11) 得 


4.404 | 

ù = > x 107 0. 22 
= 26.119 | 

Ày = 710 1. 31 


所 以 A 的 置信 水 平 为 0.95 的 置信 区 间 为 [0. 22,1. 31]. 
35.6 It pE E KiB 


比率 户 是 经 常会 遇 到 的 一 个 量 ,如 产品 的 不 合格 品 率 、 某 一 电视 节目 的 收 
杭 率 、 对 某 项 政策 的 支持 率 等 等 ,为 对 p 作 估 计 , 我 们 可 以 把 p 看 成 是 一 个 服 
从 二 点 分 布 总 体 的 参数 ,以 某 产品 质量 而 言 ,用 X 记 检 查 一 个 产品 的 不 合格 
MAX == 1 表示 该 产品 为 不 合 衬 品 ,X= 0 表示 该 产品 是 合格 品 , 从 而 当 该 产 
号 的 不 合格 品 率 为 p 时 ,X 便服 从 二 点 分 布 5(1,p): 

| PX=D=p»p P(X=0=1-p 
p 便 是 该 二 点 分 布 的 期 望 ,E(X) = p, 而 Var(X) =p(1— p). 

MT 2, 可 从 二 点 分 布 总 体 中 进行 抽样 ,获得 容量 为 n 的 样本 XX, 

… ,一般 都 取样 本 均值 X 作为 p 的 点 估计 。 


为 对 p 作 区 间 信 计 , 需 要 研究 样本 和 了 = DI X 的 分 布 ， 


5. 6.1 小 样本 场合 下 p 的 置信 区 间 
设 Xis Aze DE 为 取 目 二 点 分 布 2(1 ;Pp) 的 一 个 样本 , 则 工 一 NX, RA 


A 2 
获得 .具体 做 法 如 下 
DICO 是 二 项 分 布 6ln,p) 的 分 布 函数 , 则 


Gl(y;p) 一 Na 一 四) 
Za 


k n E 
= Sra py ">, y>0 (5.6.1) 
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a E A a 


其 中 = [yj 的 整数 部 分 ) 。 利 用 分 部 积分 法 可 知 
l1—Gl(y;p) | 


=*-+1 


n PEA — py? 
XL 


Fant 1) 


= Fa re al el — uy du, 0O<p<l 


(5. 6. 2) 


在 y 固 定时 ， 上 式 右 端 可 以 看 成 是 参数 为 十 1 与 4 一 的 贝塔 分 布 的 分 
布 消 数 ,从 而 1 一 Gl(y;p) Æ p 的 严 增 函 数 ,由 此 可 知 二 项 分 布 的 分 布 沙 数 
COUPE? 的 连续 的 严 减 沙 数 。 
(2) 由 定理 5.5.2 知 ,p 的 1 一 a 置信 区 间 [p, po] 的 两 端点 pr 和 pu 应 分 
别 满 足下 列 两 式 
人 — 0; pL) = 1 — e/2 
Gly; pu) = a/2 
由 (5. 6.1) 知 , 上 两 式 等 价 于 


k—1 


Sapo =1-a/ 


x=0 


(5. 6. 3) 
>, | "oa 一 pu)" = a/2 


这 里 是 工 一 yx 的 观察 值 。 


(3) 如 何 从 (5 6. 3) 中 的 两 个 方程 分 解 出 pr 和 加 呢 ? 这 个 计算 问题 可 用 
F 分 布 完成 .在 (5. 6.2) pS 


则 有 


In + 1) 15 y 


rk + DEC 一 &)Jo (+ ya 


] — Gy; p) = 


k 
再 令 U 一 7 + Lw,» = 2(k + 1); = 2(n — k), DJ 得 


k 
ERA, 
Pr [at] (E T7 
l= GOP) = FEF Dra De kil pe 
(14 Lo] 
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Y + ， 
TT A dw 
op ajr 2: (1, + 10) tr 

2 2 | 

y 
=F 2 in 


REAREN É EA n Mv W FARRE ed 处 的 值 .综合 
上 述 , 可 得 如 下 公式 


ri 


2 


ak +1 
这 就 是 用 FF 分 布 计算 二 项 分 布 的 一 般 公式 。 
(4) 利用 公式 (5. 6.4) 来 解 方 程 组 (5. 6. 3) 。 先 把 (5. 6. 3) 改写 为 


n 


>> | "| pa 一 py = E 
XI 


n x _ nr 一 Y P _. 
"a p) Py Ip 


j Y1 9,12 (5.6.4) 


工 二 点 2 
5 "|a pu)"*—1— < 
z=k+1' A 2 


利用 (5. 6. 4) ,可 得 . 


= 2k, v, =2(n—k+1) 


F| 2 enm) = 1, n=2(k +1), v= 2n — k) 


Y 1— pv 2 
三 下 分 布 表 可 得 
y 
IE S Ena 
> = Fia 041 942) 


bi = YF ,2s (V1 0) 
EO Wa HYF) 


by = YE i—a/2 (Y1 Y2) 
Y HAS a 01 VY) 
WIER A ARA Lp) pu] 就 是 p 的 1 一 a 和 置信 区 间 ， 
例 5.6.1 从 一 批 产品 中 随机 抽查 63 件 ,发 现 有 3 件 不 合格 品 , 求 这 批 产 
癌 的 不 合格 品 率 p 的 0. 90 置信 区 间 。 
解 :在 这 个 问题 中 ,n = 63, = 3, 故 p ES b = 0.048. FEAIA 
(5.6.5) 式 来 求 户 的 置信 区 间 。 


(5. 6. 5) 
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a - Bo it ee th et 4 RP i er te rr 


Y, = 2k = 6, Y, = 2lmn — k+ 1) = 122 
Foo (6,122) = 1/Fo.35 (4122,6) = 1/3. 70 


= 6/3.70 
PL = 122 + 6/3. 70 


vy =2(k+1)=8, v= 2lm — k) = 120 
Fo0s(8,120) = 2. 02 


= 8x202 
bu = izg +8 x 2.02 Ù H? 


故 这 批 产 品 的 不 合格 品 率 的 0. 90 置信 区 间 为 [0. 013,0. 119]. 


= 0.013 


5.6.2 大 样本 场合 下 p HAMETE A iE 
当 总 体 瑟 一 56(1,) 时 ,只 要 2 足够 大 ,根据 中 心 极限 定理 ,可 以 认为 元 渐 
近 正 态 分 布 .现在 EX = p,Var(X) = pA — p/n, AMR E n EWK, A 


U= 一 和 二 记 -~ No,1) 
N p1 — p)/n 


所 以 可 将 U BEREX b 作 区 间 佑 计 , 由 


<w.s|- l— a 


P| =P 
Vp — pin 


可 以 从 

A | S“ 
去 解 出 p 的 范围 .由 于 上 式 等 价 于 
亦 等 价 于 


Cn + ue) pt — (2nX + ip + nX? <0 
Wa = n + uit, b= (2nX 二 uti-s),c = nX’, Wj a > 0,6 — 4ac = 
(2nX +ui-g)* — 4(n + ui_2) o nX? = 4nX (1 — X)ui_< + uja 之 0, 故 二 
三 项 式 ap + bp 十 c 开 口 向 上 ,有 两 个 实 根 pi 与 pu( 见 图 5. 6.1), 故 当 p 满足 


P p o” 


5.6.1 求 姑 ,pr 的 示意 图 
208 


PLS PS Pu 
可 使 ap? + bp +c <0, HH 
— b — Vb? — 4ac = mo HNE — 4ac 
六 2a 
从 而 p 的 置信 水 平 为 1 一 a 的 置信 区 间 为 
[pr, pu] 
其 中 pL, pu 如 (5. 6. 6) 式 所 示 , 当 (5. 6.6) 式 中 pi 二 0 时 , 取 pr = O. 
例 5.6.2 在 某 电视 节目 收视 率 调查 中 ,调查 了 400 人 ,其 中 有 100 人 收 
看 了 该 电视 节目 , 试 对 该 节目 收视 率 p 作 置 信 水 平 为 0. 95 的 区 间 估 计 。 
解 : 在 本 例 中 ,n = 400, 当 取 a== 0. 05 Ff uos = 1. 96, X Atek RET 


100 _ 
400 0-25, 从 而 


a = 400 + 1. 96? = 403. 8416 
b =— (2 X 400 X 0.25 + 1.96%) =— 203. 8416 
c = 400 X 0. 25? 一 25 

代入 (5. 6. 6) , 求 得 


(5.6.6) 


— 203. 8416 一 34. 1649 _ 0. 2101 


PL = 807. 6832 
= 203.8416 + 34. 1649 
Pu = 807. 6832 = 0. 2347 


从 而 p 的 置信 水 平 为 0. 95 的 置信 区 间 是 
| [0. 2101, 0. 2947] 


"$587 贝 叶 斯 估计 


统 计 学 中 有 两 大 学 派 :频率 学 派 (又 称 经 典 学 派 ) 和 贝 叶 斯 学 派 ,它们 的 理 
论 与 方法 者 建立 在 概率 论 基 础 上 ,应 用 都 相当 广泛 ,本 书后 四 章 主要 介绍 经 典 
统计 学 的 基本 内 容 , 仅 在 这 一 节 以 贝 叶 斯 估计 为 题 对 贝 叶 斯 统计 作 一 些 介绍 。 


5.7.1 统计 推断 中 的 三 种 信息 
我 们 在 前 面 的 统计 推断 (点 估计 、 区 间 估 计 等 ) 中 用 到 了 两 种 信息 
(1) 总 体 信息 ， 即 总 体 分 布 或 总 体 所 属 分 布 族 给 我 们 的 信息 .譬如 ,< 总 体 
是 正 态 分 布 ” 这 一 句 话 就 给 我 们 带 来 很 多 信息 : 它 的 密度 函数 是 一 条 钟 形 曲 
269 


线 ; 它 的 一 切 阶 和 矩 都 存在 ;有 许多 成 熟 的 统计 推断 方法 可 供 我 们 选用 等 .总 体 
信息 是 很 重要 的 信息 ,为 了 获取 此 种 信息 往往 耗资 巨大 。 我 国 为 确认 国产 轴承 
寿命 分 布 为 威 布尔 分 布 前 后 花 了 五 年 时 间 , 处 理 了 几 于 个 数据 后 才 定 下 的 。 

(2) 样本 信息 , 即 样本 提供 给 我 们 的 信息 ,这 是 最 “新 鲜 ” 的 信息 ,并 且 越 
多 越 好 ,希望 通过 样本 对 总 体 或 总 体 的 某 些 特征 作出 较 精确 的 统计 推断 。 没 有 
样本 就 没有 统计 学 可 言 。 

基于 以 上 两 种 信息 进行 统计 推断 的 统计 学 就 称 为 经 典 统计 学 。 然 而 在 我 
们 周围 还 存在 着 第 三 种 信息 一 一 先 验 信息 , 它 也 可 用 于 统计 推断 。 

(3) 先 验 信息 , 即 在 抽样 之 前 有 关 统 计 问 题 的 一 些 信息 ,一般 说 来 , 先 验 
育 妃 来 源 于 经 验 和 历史 资料 。 先 验 信 息 在 日 常生 活 和 工作 中 是 很 重要 的 。 先 看 
两 个 例子 。 

例 5.7.1 英国 统计 学 家 Savage, L.J. 曾 考察 了 如 下 两 个 统计 试验 ， 

(1) 一 位 常 饮 牛奶 加 茶 的 妇女 声称 ,她 能 辨别 先 倒 进 杯 子 里 的 是 茶 还 是 
牛奶 .对 此 做 了 十 次 试验 ,她 都 正确 地 说 出 了 。 
(O) 一 位 音乐 家 声称 ,他 能 从 一 页 乐谱 辨别 出 是 海顿 (Haydn) 还 是 莫 扎 
等 (Mozart) 的 作品 ,在 十 次 这 样 的 试验 中 ,他 都 辨别 正确 。 

在 这 两 个 统计 试验 中 , 假如 认为 被 试验 者 是 在 猜测 ,每 次 成 功 概率 为 
0.5 ,那么 十 次 都 猜 中 的 概率 为 27 = 0. 0009766 .这 是 很 小 的 概率 ,是 几乎 不 
可 能 发 生 的 。 所 以 认为 “每 次 成 功 概率 为 0. 5” 应 被 拒绝 ,认为 试验 者 每 次 成 功 
概率 要 比 0.5 大 得 多 ,这 就 不 是 猜测 ,而 是 他 们 的 经 验 帮 了 他 们 的 忙 , 可 见 经 
验 ( 先 验 信息 的 一 种 ) 在 推断 中 不 可 忽视 。 

例 5.7.2 “免检 产品 ” 是 怎样 决定 的 ? 某 工 厂 的 产品 每 天 要 抽检 几 件 , 获 
得 不 合格 品 率 9 的 估计 .经 过 一 段 时 间 后 ,就 可 根据 历史 资料 ( 先 验 信息 的 一 
种 ) 对 过 去 产品 的 不 合格 品 率 0 构造 一 个 分 布 


P(0 = 一 ) = Nis 1 =0,1,2,*»"",2 (5. 7.1) 


这 种 对 先 验 信息 进行 加 工 获得 的 分 布 今 后 称 为 先 验 分 布 .有 了 这 种 先 验 分 布 
就 可 得 到 对 该 厂 过 去 产品 的 不 合格 品 率 9 的 一 个 全 面 看 法 。 如 果 这 个 分 布 的 
概率 绝 大 部 分 集中 在 9 = 0 附近 ,那么 该 产品 可 以 认为 是 “信得过 产品 ”假如 
以 后 的 多 次 抽检 结果 与 历史 资料 提供 的 先 验 分 布 是 一 致 的 , 那 就 可 以 对 它 作 
出 “免检 产品 ”的 决定 ,或 者 每 月 抽检 一 次 就 足够 了 ,这 就 省 去 了 大 量 的 人 力 
与 物力 .可 见 , 历 史 资 料 在 统计 推断 中 应 该 加 以 应 用 。 

基于 上 述 三 种 信息 进行 统计 推断 的 统计 学 称 为 贝 叶 斯 统计 学 。 它 与 经 典 
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统计 学 的 差别 就 在 于 是 否 利用 先 验 信息 。 贝 叶 斯 统计 在 重视 使 用 总 体 信息 和 
样本 信息 的 同时 ,还 注意 先 验 信息 的 收集 、 挖 握 和 加 工 ,使 它 数量 化 ,形成 先 验 
分 布 , 参 加 到 统计 推断 中 来 ,以 提高 统计 推断 的 质量 ,忽视 先 验 信息 的 利用 ,有 
时 是 一 种 浪费 ,有 时 还 会 导出 不 合理 的 结论 ，。 

贝 叶 斯 统计 起 源 于 英国 学 者 贝 叶 斯 (Bayes, T.R. 1702(?) 一 1761) 死 后 
发 表 的 一 篇 论文 “ 论 有 关机 过问 题 的 求解 ”, 在 此 文中 提出 了 著名 的 贝 叶 斯 公 
AL §1.5 和 一 种 归纳 推理 的 方法 ,之 后 ,被 一 些 统计 学 家 发 展 成 一 种 系统 
的 统计 推断 方法 。 到 本 世纪 30 年 代 已 形成 贝 叶 斯 学 派 ,到 50 — 60 年 代 已 发 展 
成 一 个 有 影响 的 统计 学 派 ,其 影响 还 在 日 益 扩 大 。 

贝 叶 斯 学 派 的 最 基本 的 观点 是 : 任 一 未 知 量 9 都 可 看 作 随 机 变量 ,可 用 一 
个 概率 分 布 去 描述 ,这 个 分 布 称 为 先 验 分 布 ,因为 任 一 未 知 量 都 有 不 确定 性 ， 
而 在 表述 不 确定 性 的 程度 时 ,概率 与 概率 分 布 是 最 好 的 语言 。 例 5. 7. 2 中 产品 
的 不 合格 品 率 9 是 未 知 的 ,但 每 天 都 在 变化 ,把 它 看 成 随机 变量 是 合理 的 ,用 
一 个 概率 分 布 去 描述 它 是 恰当 的 。 再 看 下 面 一 个 例子 。 

例 5.7.3 某 地 区 煤 的 储存 量 9 在 几 百 年 内 不 会 有 多 大 变化 ,可 看 作 是 一 
个 常量 ,但 对 人 们 来 说 , 它 是 未 知 的 \ 不 确定 的 量 , 有 位 专家 研究 了 有 关 资 料 ， 
结合 他 的 经 验 认为 ;该 地 区 煤 的 储存 量 8 大概 有 5 亿 吨 左右 ”。 若 把 “左右 ” FE 
解 为 4 到 6 亿 吨 之 内 ,把 “大 概 ” 理 解 为 80% 的 把 握 , 还 有 20% 的 可 能 性 在 此 
区 间 之 外 ( 见 图 5. 7. 1) .这 无 形 中 就 是 用 一 个 概率 分 布 ( 这 一 分 布 的 确定 是 用 
主观 概率 ) 去 描述 未 知 量 0, 而 具有 概率 分 布 的 量 当然 是 随机 变量 。 


煤 的 储存 是 ( 亿 吨 ) 的 描述 


关于 未 知 量 是 否 可 看 作 随 机 变量 在 经 典 学 派 与 贝 叶 斯 学 派 间 争 论 了 很 长 
时 间 。 如 今 经 典 学 派 已 不 反对 这 一 观点 ,著名 的 美国 经 典 统计 学 家 Lehmann， 
.二 .在 他 的 《点 佑 计 理 论 》 一 书 中 写 道 ;“ 把 统计 问题 中 的 参数 看 作 随 机 变量 的 
实现 要 比 看 作 未 知 参数 更 合理 一 些 ”。 如 今 两 派 的 争论 焦点 是 :如 何 利 用 各 种 先 
验 信息 合理 地 确定 先 验 分 布 .这 在 有 些 场合 是 容易 解决 的 ,但 在 很 多 场合 是 相 
当 困难 的 .这 时 应 加 强 研究 ,发 展 贝 叶 斯 统计 ,而 不 宜 简单 处 置 ,引起 非 难 . 
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图 5.7.1 


5.7.2 贝 叶 斯 公式 的 密度 函数 形式 

贝 叶 斯 公式 的 事件 形式 已 在 $ 1. 5 中 叙述 这 里 用 随机 变量 的 密度 函数 
再 一 次 叙述 贝 叶 斯 公式 ,并 从 中 介绍 贝 叶 斯 学 派 的 一 些 具体 想法 ， 

(1) 依赖 于 参数 9 的 密度 函数 在 经 典 统计 中 记 为 p(x;0), 它 表示 参数 空 
间 @ 中 不 同 的 9 对 应 不 同 的 分 布 .在 贝 叶 斯 统计 中 应 记 为 p(z10) , 它 表示 在 随 
机 变量 6 给 定 某 个 值 时 ,X 的 条 件 密度 函数 。 

(2) 根据 参数 9 的 先 验 信息 确定 先 验 分 布 +(9)， 

D 从 贝 叶 斯 观点 看 ,样本 XX (XX X) 的 产生 要 分 两 步 进行 。 首 
先 设想 从 先 验 分 布 O) 产生 一 个 样本 O ,这 一 步 是 “老天爷 ” 做 的 ,人 们 是 看 
不 到 的 , 故 用 “设想 ” 二 字 。 第 二 步 从 p(z19) 中 产生 一 个 样本 天。 这 时 样本 天 
的 联合 条 件 密度 函数 为 


pX 10) 一 PCziyzz 2 00) = [| ptz, 10) (5.7.2) 


这 个 联合 分 布 综合 了 总 体 信 息 和 样本 信息 ,又 称 为 似 然 函 数 。 

(4) 由 于 2& 是 设想 出 来 的 ,仍然 是 未 知 的 , 它 是 按 先 验 分 布 (9) 产生 的 。 
为 把 先 验 信息 综合 进去 ,不 能 只 考虑 8 ,对 9 的 其 它 值 发 生 的 可 能 性 也 要 加 以 
考虑 , 故 要 用 nO 进行 综合 .这 样 一 来 ,样本 不 和 参数 0 的 联合 分 布 为 

h(x,0) = p(xi0r(0) > (5. 7. 3) 

这 个 联合 分 布 把 三 种 可 用 信息 都 综合 进去 了 。 

(5) 我 们 的 任务 是 要 对 未 知 参数 9 作 统计 推断 。 在 没有 样本 信息 时 ,我 们 
只 能 依据 先 验 分布 x(9) 对 9 作出 推断 .在 有 了 样本 观察 值 x = (1,29 000,10) 
之 后 ,我 们 应 依据 h(x,0) 对 6 作出 推断 , 若 把 h(x,9) 作 如 下 分 解 : 


h(x,0) = xr(0|x)m(x) (5.7.4) 
EFP ma) 是 五 的 边缘 密度 函数 ， 
m(x) = [46,040 = | ¿GOTO (5.7.5) 


ESA R Kma PRE OEA. ACEROS O VE HEREDIA AN. 
是 条 件 分 布 x(C2|z), 它 的 计算 公式 是 

mO |x) = O 一 NPAC ACLA CNN (5.7.6) 

m(x | LaCr1o)rCb)d6 
这 就 是 贝 叶 斯 公式 的 密度 函数 形式 .这 个 条 件 分 布 称 为 9 的 后 验 分 布 , 它 集中 
了 总 体 、 样 本 和 先 验 中 有 关 0 的 一 切 信息 。 它 也 是 用 总 体 和 样本 对 先 验 分 布 
CO) 作 调 整 的 结果 , 它 要 比 r0) 更 接近 2 的 实际 情况 ,从 而 使 基于 (0 la) 对 
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O 的 推断 可 以 得 到 改进 。 

(5.7. 6) 式 是 在 X 和 2 都 是 连续 随机 变量 场合 下 的 贝 叶 斯 公式 .其它 场 合 
下 的 贝 叶 斯 公式 容易 写 出 。 壁 如 在 义 是 离散 随机 变量 和 6 是 连续 随机 变量 时 ， 
只 要 把 (5. 7. 6) 中 的 密度 函数 p(x10) 改 为 概率 ¿lO 即 可 ;而 当 0 为 离散 随 
机 变量 时 ,只 要 把 (5.7.6) 中 先 验 密 度 函 数 O 改 为 先 验 分 布 列 r(bD) i= 1, 
2.,…，, 把 积分 改 为 求 和 即 可 。 

例 5.7.4 设 事件 4 的 概率 为 9, 即 P(A) =0。. 为 了 估计 0, 进 行 了 > 次 独 
立 观察 ,其 中 事件 4 EIA X BAX — b(2,0), Bl: 


P(X 三 工 |0) = MES — 03%, x=0,1,"",n (5.7.7) 


这 就 是 似 然 函数 。 假 如 在 试验 前 ,我 们 对 事件 4 没有 什么 了 解 ,从 而 对 其 发 生 
的 概率 9 也 说 不 出 是 大 是 小 。 在 这 种 场合 , 贝 叶 斯 建议 用 区 和 间 (0,1) 上 的 均匀 
分 布 U(C(0,1) 作为 2 的 先 验 分 布 , 因 为 它 取 (0,1) 上 每 点 都 机 会 均等 . 贝 叶 斯 的 
这 个 建议 被 后 人 称 为 贝 叶 斯 假设 .这 里 0 的 先 验 分 布 为 
n= 92031 (5.7.8) 
O, HE 
为 了 综合 试验 信息 和 先 验 信 息 , 可 利用 贝 叶 斯 公式 。 为 此 先 计算 样 本 X 
与 参数 0 


htx,0) 一 “laz — a. » z=, lsn, 0<X<0<1 (5. f. 9) 


从 形式 上 看 ,此 联合 分 布 与 (5.7.7) 没有 差别 ,可 在 定义 域 上 有 差别 。 再 计算 
EE X 的 边缘 分 布 ， 


múx) = | An,0)a6 — 
0 


n | 4 (1 — 040 
Æ 0 


o fnr + Drm — r+) 
= (z) Ta +2 (5. 7. 10) 
将 (5. 7. 9 除 以 (5. 7. 10), 即 得 0 的 后 验 分 布 为 ; 
_ h(x,0) 
r(0lx) 一 (9) 
¡IMC + 2) ge+D=1(7 _ 8) e=+D-1 , 0 < 一 C < 一 1 


"“TG+DIG-—x+1) 
XAFESMAA 2+15n—1+14U01124H% Belx+ ln-x2+D. 
拉 普 拉 斯 在 1786 年 研究 了 巴黎 男 婴 诞生 的 比率 6 是 否 大 于 0. 5。 为 此 他 
收集 了 1745 年 到 1770 年 在 巴黎 诞生 的 婴儿 数据 ,其 中 男 婴 为 251527 个 , 女 婴 
为 241945 个 .他 选用 UC0,1) 作为 8 的 先 验 分 布 ,于 是 得 96 的 后 验 分 布 为 Bezx 
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+ 1ln—23+1),H HF n = 251527 + 241945 = 493472, 工 一 251527, 利 用 这 
一 后 验 分 布 , 拉 普 拉 斯 计算 了 “2 科 0.5” 的 后 验 概 率 : 


rn + 2) 9-3 I n—x 
P(0 < 0.512) = Fr | 9 (1 — 07-40 


当年 拉 普 拉 斯 把 被 积 函数 0*(1 一 ON 在 最 大 值 处 展开 ,然后 对 上 述 不 完 
全 贝塔 函数 作 近 似 计算 ,最 后 结果 为 

P(0< 0.5lx) =1.15 X 107“ 
由 于 这 一 概率 很 小 , 故 他 以 很 大 的 把 握 断 言 : 男 婴 诞生 的 概率 大 于 0. 5 — 
结果 在 当时 是 很 有 影响 的 。 


5.73 ”共和 斩 先 验 分 布 

我 们 知道 ,在 区 间 (0,1) 上 的 均匀 分 布 是 贝塔 分 布 Be(1,1)。 从 例 5.7.4 
中 可 以 看 到 一 个 有 趣 的 现象 ;二 项 分 布 b(n,9) 中 的 成 功 概率 9 的 先 验 分 布吉 
E Be(1,1), 则 其 后 验 分 布 也 是 贝塔 分 布 Bel(x 十 1,n 一 工 十 1), 先 验 分 布 与 后 
验 分 布 同 属 一 个 贝塔 分 布 族 , 只 不 过 参数 不 同 罢了 ,这 一 现象 不 是 偶然 的 , 假 
如 把 9 的 先 验 分 布 换 成 一 般 的 贝塔 分 布 Bel(a,5), 其 中 a > 0,6 二 0, 则 经 过 类 
似 的 计算 可 以 看 出 9 的 后 验 分 布 仍 是 贝塔 分 布 Bela + 2,b 十 一) ,此 种 先 
验 分 布 称 为 9 的 共 斩 先 验 分 布 。 在 其 它 场合 还 会 遇 到 其 它 共 斩 先 验 分 布 , 它 的 

定义 5.7.1 设 9 是 某 分 布 中 的 一 个 参数 ,zx(0) 是 其 先 验 分 布 .假如 由 抽 
样 信息 算 得 的 后 验 分 布 x(0|x) 5x0 是 同属 于 一 个 分 布 族 , 则 称 x(2) 是 9 的 
HARINA. 

从 这 个 定义 可 以 看 出 AEREA MEAR IA SO AA AR 
指定 参数 及 其 所 在 的 分 布 , 谈 论 共 罗 先 验 分 布 是 没有 意义 的 .常用 的 共 轿 先 验 
分 布 列 于 表 5. 7. 1 中 。 

表 5.7.1 常用 的 共 辆 先 验 分 布 


总 体 分 布 参数 共 斩 先 验 分 布 
二 项 分 布 成 功 概 率 贝塔 分 布 
泊 松 分 布 均值 (1033745 
指数 分 布 均值 倒数 1038 77 4h 
正 态 分 布 (方差 已 知 ) 均值 正 态 分 布 
正 态 分 布 ( 均 值 已 知 ) 方差 11033774 | 


注 : 若 X Ta) W 1/X (93:68 AMA. 
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例 5.7.5 正 态 均值 (方差 已 知 ) 的 共 斩 先 验 分 布 是 正 态 分 布 。 
证 : 设 XiX X, EXB ESD M NGO, o) HTE, HP A 已 知 。 
此 样本 的 联合 密度 函数 为 


{| As _ py L ww be. 00 
p(x|0) = (7) exp| INS 0) |, < Lat g En L 
再 取 男 一 正 态 分 布 Nh) 作为 正 态 均值 9 的 先 验 分 布 , 即 
ol f la _ 
XT(0) = exp | zi 站 | , Li 


其 中 与 为 已 知 ,由 此 可 写 出 样本 x 与 参数 0 的 联合 密度 函数 ， 


] 一 2n0x + DE 
pu f= 


404.0) = h exp | — o ¿PO || 
g r’ 


Hp ki 一 Crta", z = a ro Ema 


gÉ 1 1 == >r 2 
2_ J 4 ES — Z E — i=l E 
J =? A= t B= T p C = g? + 
则 有 
h(x,0) = k + exp| 一 5 [Ae — 20B + CJ 
DL., _ @>~ B/A} ”~ £ 
| = k exp | 2/A ¿[e Al 
由 此 容易 算得 样本 下 的 边缘 分 布 
co , 1 
m(x) = | hz,0)40 一 Ri œ exp | 一 Le — A 上 (27) í 
将 上 述 两 式 相 除 , 即 得 0 的 后 验 分 布 
AG) 12r1 -和 (0 — B/A)? 
TO) = na 一 | | exp | — 2/A | 
这 是 正 态 分 布 , 其 均值 a BECARIA 
B 0 2 
a A , a = i = (0 4097 (5.7.11) 


2 X ~ N(0,2?),80 ~ 和 NN(10,37), 若 从 总 体外 中 抽 得 容量 为 5 的 样本 ,算得 
F= 12.1, 则 从 (5.7.11) 算得 A = 11. 93,oi = | $|? ,此 时 6 的 后 验 分 布 为 
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6 2 
Nal. 93, | 4, ) 。 


共 恩 先 验 分 布 中 常 含 有 未 知 参 数 , 先 验 分 布 中 的 未 知 参 数 称 为 超 参 数 。 在 
先 验 分 布 类 型 已 定 , 但 其 中 还 含有 起 参数 时 ,确定 先 验 分 布 的 问题 就 转化 为 们 
计 超 参数 的 问题 ,下 面 的 例子 虽 仅 涉及 贝塔 分 布 ,但 其 确定 超 参 数 的 方法 在 其 
它 分 布 中 也 可 用 。 

B45.7.6 表面 已 指出 :二 项 分 布 中 成 功 概率 0 的 共 斩 先 验 分 布 是 贝塔 分 
布 Be(a ,5)。 现 在 来 讨论 此 共 恩 分 布 中 的 两 个 超 参 数 a 与 上 如 何 确定 。 下 面 分 
几 种 情况 讨论 : 

(1) 假如 根据 先 验 信息 能 获得 成 功 概率 9 的 若干 个 (间接 ) 观察 值 0 ,0,， 
… ,0, 一般 它们 是 从 历史 数据 整理 加 工 获 得 的 ,由 此 可 算得 先 验 均值 5 与 先 验 
方差 S55 为 ， 


z lx _ 1 7 
I= 240 Síp 一 n 2 A D 


由 于 贝塔 分 布 的 均值 与 方差 分 别 为 
ad 
E(0) = PENEN 
— ab 
Var = CF HA FIFD 
则 令 
E = ĝ 
Var(0) = S?, 


解 之 , 即 可 得 超 参 数 a 与 2 的 矩 法 估计 值 : 
4 一 A — 1), p= a 9 g Ml 1] 


(2) 假如 根据 先 验 信息 只 能 获得 先 验 均值 9, 可 令 


a 
| apo? 
但 一 个 方程 不 能 唯一 确定 两 个 未 知 的 超 参数 ,譬如 5 = O. 4 MA = 


0. 4 的 a 与 5 有 无 穷 多 组 解 . 表 5.7.2 列 出 了 若干 组 ,从 表 中 可 见 ,它们 的 方差 

Var(0) KE a + b 的 增 大 而 减 小 ,方差 减 小 意味 着 概率 向 均值 (9) 集中 ,从 而 

提高 EO) = 0.4 的 确信 程度 .这样 一 来 ,选择 ac 十 5 的 问题 转化 为 决策 人 对 

ECO) 一 0.4 的 确信 程度 大 小 的 问题 . 若 对 无 (0) = 0.4 很 确信 ,那么 a 十 5 可 选 

得 大 一 些 , 否则 就 选 得 小 一 些 。 壁 如 决策 人 对 五 (6) = 0.4 很 确信 ,从 而 选 a 十 
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b= 35。 从 表 5.7.2 知 ,此 时 4 = 14,6 = 21, LS URAA 
Be(14,2D. 
表 5.7.2 贝塔 分 布 中 超 参 数 与 方 美的 关系 


DEA a a+b E8) Var(0) 
Be(2,3) 2 5 0. 4 0. 0400 
Be(4,6) 4 10 0. 4 0. 0218 
Be(3,12) 8 20 | O. 4 0. 0114 
Be(10,15) 10 25 0. 4 0. 0092 
Be(14,21) 14 35 0.4 0. 0067 


(3) 用 两 个 分 位 数 来 确定 a 与 8。 璧 如 用 两 个 上 .下 四 分 位 数 名 与 多 来 确 
定 4 与 5。 从 图 5.7.2 上 可 见 ,9 与 纪 满足 如 下 两 个 方程 ， 
l(a+0b) 


Fa — 0) 'd9 = 0. 25 


o Lar Cb) 
(Ca 十 已) 1 — 一 1 mo 
LES a 01 2d9 = 0. 25 
由 先 验 信息 定 出 9 与 bv AE RA a 与 2 这 需要 用 到 数值 积分 ) 。 
x(0 


Be(a,b) 的 密度 曲线 


0.25 0.25 
0 6 0 1 
图 5.7.2 贝塔 分 布 的 上 ,下 四 分 位 数 


(4) 如 采 对 成 功 概率 9 的 先 验 信息 很 缺乏 ,说 不 上 0 在 哪个 区 域 有 更 大 的 
概率 ,这 时 可 用 均匀 分 布 Be(1,1) 作为 0 的 先 验 分 布 ,此 时 4 = 1,6 = 1, 这 便 
是 前 面 说 过 的 贝 叶 斯 假设 。 


5.74 贝 叶 斯 点 估计 
后 验 分 布 AO |) 综合 了 总 体 OCIO) PA x MER O) 中 有 关 O 的 信 
时 ,如今 要 寻找 参数 0 的 估计 9, 当然 要 从 后 验 分 布 OO 中 提取 信息 .从 
(0 lx) 中 提取 关于 6 的 信息 有 三 种 常用 的 方法 ;使 后 验 密度 达到 最 大 的 0, 后 
验 分 布 的 中 位 数 ,后 验 分 布 的 均值 .用 得 最 多 的 是 后 验 分 布 的 均值 。 
277 


定义 5.7.2 0 的 后 验 分 布 的 期 望 值 称 为 8 的 后 验 期 望 估 计 , 也 简称 贝 叶 
斯 估计 , 常 记 为 Vp。 

定理 5.7.1 设 9 的 后 验 密度 为 x(9|x), 则 后 验 期 望 估计 如 使 均 方 误差 
达到 最 小 。 

证 ;0s 的 均 方 误差 MSE(0s) = Es — 0), FTE (O lx) 下 进行 计算 . 


EÔ, 一 0)? 一 | — Oyn (Oldo 


= % 20, | Or (0|z)d0 + | .9c0 lz)a0 
这 是 Oy 的 二 次 三 项 式 , 其 二 次 项 系数 为 正 , 必 有 最 小 值 .用 微分 法 对 其 求 导 并 
令 其 为 0, 便 有 
20 — 2 [oro xao =0 
即 - 
dy = | gr (Olx)d0 = E(0|x) 
$ 


下 面 看 几 个 例子 。 
Bl 5.7.7 设 Xy DEPE Xn 是 来 目 N(0,0%) 的 一 个 样本 ,其 中 a? 已 知 ,0 
为 未 知 参数 ,假如 9 的 先 验 分 布 为 NCp,r), 其 中 p 与 已 知 , 试 求 9 的 贝 叶 斯 
估计 。 
REFERIA NG) EERIE TEA, 5. 7.540, 
在 样本 :~ 一 《2Z1Tz9 Tp) 给 定 的 条 件 下 ,0 的 后 验 分 布 为 NUCA ,GT ) ,其 中 Pan 
of 如 (5.7.11) 所 示 ,A 即 为 后 验 分 布 的 期 望 , 故 2 的 贝 叶 斯 估计 
Zoo 十 pr 
= p] 二 a? + q? 
R oi = EEEn = a a E EOS 
y. 
0 = r,T + A —roOe (5.7.12) 
其 中 RR IR ar 由 样本 均值 的 方差 MERDE 
rz 算得 . 当 ct > 7 BHhi,r, <5 ,1— r, >> > ,于 是 从 (5. 7.12 可 以 看 出 在 贝 叶 
斯 估计 中 先 验 均值 x 占 的 比重 大 一 些 ， 人 下 更 上 也 E HTE o? > 
ESTE MRAZ <A i,r, >> ra 
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在 贝 叶 斯 估计 (5.7.12) 中 样本 均值 未 占 的 比重 大 一 些 。 特 别 当 m 王 0 时 ,这 时 
00 一 co0, 这 表示 没有 样本 信息 , 故 贝 叶 斯 估计 只 能 用 先 验 均值 了 ,而 当 7, = 1 
时 ,这 时 7% = oo, 这 表示 没有 任何 先 验 信息 可 用 , 故 贝 叶 斯 估计 就 取经 典 估计 
元。 从 上 述 解 释 可 以 看 出 ,用 (5. 7. 12) 表示 的 贝 叶 斯 估计 是 十 分 合理 的 。 

作为 一 个 数值 例子 ,我 们 考 虚 对 一 个 儿童 做 智力 测验 , 设 测验 结果 XX ~ 
N(0,100), 其 中 0 为 这 个 儿童 的 智商 的 真 值 . 若 又 设 9 ~ N (100,225) .应 用 上 
述 方法 ,在 2 一 1 时 ,可 得 在 给 定式 = 工 条 件 下 ,该 儿童 智商 0 的 后 验 分 布 是 正 
仿 分 布 N (p01) ;其 中 

__ 100 x 100 + 225x _ 400 + 9x 


! 100 十 225 13 


e 100x225 _ 900 _ O 2 
1 100 十 225 13 = 69. 23 = (8. 32) 


假如 这 个 儿童 测验 得 分 为 115 分 。 则 他 的 智商 的 贝 叶 斯 估计 为 


p, = 400 +9 x 115 110.38 


例 5.7.8 为 估计 不 合格 品 率 9, 今 从 一 批 产品 中 随机 抽取 件 , 其 中 不 
合格 品 数 为 和 ,又 设 0 的 先 验 分 布 为 贝塔 分 布 Bela,6), 这 里 a.5 已 按 例 5.7.6 
的 方法 确定 ,因而 已 知 . 求 2 的 贝 叶 斯 估计 。 

AE: E ESA AA, EET O 的 后 验 分 布 x(91z) 为 贝塔 分 布 Be(a 十 
Tb 十 一), 此 后 验 分 布 的 均值 即 为 9 的 贝 叶 斯 估计 , 故 


_ _at+az 
” a+b+n 
这 一 估计 亦 可 改写 为 
dy = LEE -一 E 04 a. 
5 a+b=Rn at+b+an a at+b+n a+b 
= 71.0, + (1 —r,)0 = (5.7.13) 


其 中 5 = y ERR Bela, b) 的 均值 , 它 可 看 作 仅 用 先 验 分 布 对 9 所 作 


的 估计 .9 = 六 是 仅 用 抽样 信息 对 9 所 作 的 极 大 似 然 估计 rm 一 -二 好 二 一 是 
权 , 它 的 大 小 取决 于 样本 量 ”的 大 小 。 当 ?很 大 时 , 将 很 接近 于 1, 于 是 贝 叶 
斯 全 计 将 很 接近 极 大 似 然 估计 红 , 即 抽样 信息 在 估计 9 中 占 主要 成 份 ; 当 较 
人 小 时 ,王将 接近 于 0, 于 是 贝 叶 斯 估计 将 很 接近 于 先 验 均值 9, 即 先 验 信息 在 估 
计 6 中 占 主要 成 份 ,这 一 现象 表明 ,各 种 信息 在 贝 叶 斯 估计 中 所 占 的 地 位 是 很 
恰当 的 。 
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了 re o == 


作为 一 个 数值 例子 ,我 们 选用 由 时 斯 假设 , 即 9 的 先 验 分 布 选 为 的 习 分 布 
LU(0,1), 它 就 是 ea 一 2 一 1 的 贝塔 分 布 。 假 如 其 它 条 件 不 变 , 那 未 2 的 贝 叶 斯 估 
计 为 
zti 

n+ 2 
它 与 极 大 似 然 估 计 O, = r/n 上 略 有 不 同 , 它 相 当 于 在 = 次 检查 中 再 追加 二 次 检 
E ,并 且 不 合格 品 也 增加 一 个 .这 里 2 与 1 正 是 均匀 先 验 分 布 能 提供 的 信息 。 
K 5.7. 3 列 出 四 个 试验 结果 。 在 试验 1 与 试验 2 中 ,抽检 3 个 产品 全 合格 ”与 
“抽检 10 个 产品 也 全 合格 ”在 人 们 心目 中 留 干 的 印象 是 不 同 的 ,后 批 的 质量 要 
比 前 批 的 质量 更 信得过 ,这 一 点 用 疡 反映 不 出 来 ,而 用 贝 叶 斯 估计 会 有 所 反 
了 上映. 类似 地 ,在 试验 3 和 试验 4 中 光 抽 检 3 个 产品 全 不 合格 ”与 “抽检 10 个 产品 
也 全 不 合格 ”在 人 们 心目 中 也 是 有 差别 的 二 个 事件 ,可 用 极 大 似 然 估计 9 看 
不 出 此 种 差别 ,而 贝 叶 斯 估计 能 反映 一 些 ,在 这 些 极端 场合 , 贝 叶 斯 估计 更 具 
有 吸引 力 。 


Or (5. T. 14) 


R573 不 合格 品 率 6 的 极 大 似 然 估 计 bi 与 贝 叶 斯 估计 Ós 


试验 号 n 工 0, = x/n bs = (z+ 1)/(n + 2) 
| 3 0 0 0. 2 
2 10 0 Q 0. 083 
3 3 3 ] 0. 8 
4 10 10 1 0. 917 


例 5.7.9 经 过 早期 筛选 后 的 彩色 电视 接收 机 (简称 彩电 ) 的 寿命 服从 指 
数 分 布 。 它 的 密度 函数 为 


palo = gen , t>0 


其 中 6 > 0 是 彩电 的 平均 寿命 。 

现 从 一 批 彩电 中 随机 抽取 =” 台 进行 寿命 试验 .试验 到 第 r 台 失 效 为 止 ,其 
FABRA 1 << <t,, H9pn—r 台 彩 电 直 到 试验 停止 时 (z,) 还 未 失效 。 
这 种 试验 称 为 截 尾 寿命 试验 ,所 得 样本 t = (t,t,,… ,it,) 为 截 尾 样本 , 试 求 彩 
电 平 均 寿 命 6 的 贝 叶 斯 估计 。 

解 : 截 尾 样本 的 联合 分 布 为 


n| 


(n — r)i [pelOLFG YT 


p(t19) = 
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= 可 Tr Jon” SN 


HEE s, 一 厂 十 刀 十 … 十 去 十 (一 > 六 称 为 总 试验 时 间 ,RG) 为 彩电 寿命 的 

为 寻求 6 的 员 叶 斯 估计 ,我 们 来 寻求 9 的 先 验 分 布 . 据 国内 外 的 经 验 ,选用 
倒 佑 玛 分 布 作为 6 的 先 验 分 布 是 恰当 的 ,假如 随机 变量 关 ~ 荆 (a,), 则 X71! 的 
分 布 就 称 为 倒 合 玛 分 布 , 记 为 IT(a,4), 它 的 密度 函数 可 算得 为 ， 


Xx{(0) = — Fo? (a+ 1) e, > 0 
其 中 a > 0,2 > 0 是 两 个 待定 参数 ,其 数学 期 望 E(b) = E. 
利用 (5. 7.6) 可 得 9 的 后 验 分 布 为 
(Olt) = _ 5 +r Tt) Ats, 3/0 , 0 > 0 
这 为 IPCa 十 ,4 十 5) > UT tb 9 的 贝 叶 斯 估计 为 
A | 
b- 十 > 一 1 


为 了 最 后 确定 这 个 估计 ,我 们 收集 大 量 的 先 验 信息 ,我 国 彩 电 生 产 厂 做 了 
大 量 的 彩电 寿命 试验 , 仅 15 个 工厂 实验 室 和 一 些 独 立 实验 室 就 对 13 142 台 彩 
电 进 行 了 共计 5 369 812 台 时 试验 ,而 且 还 对 9 240 台 彩 电 进行 了 三 年 现场 跟 
踩 试验 ,总 共 进 行 了 5 547 810 台 时 试验 .这 两 类 试验 总 共 失 效 台 数 不 超 过 250 
台 . 对 如 此 大 基 先 验 信息 加 工整 理 后 ,确认 我 国 彩电 平均 寿命 不 低 于 30 000 
小 时 , 它 的 10% 的 分 位 数 Ooa 大 约 为 11 250 小 时 ,经 过 一 些 专家 认定 ,这 两 个 
数据 是 符合 我 国 前 几 年 彩电 寿命 的 实际 情况 ,也 是 留 有 余地 的 。 

由 此 可 列 出 如 下 二 个 方程 : 


= 30 000 
a— 1 


Exodo = 0.1 
在 计算 机 上 解 此 方程 组 ,得 
a = 1.956, À = 2 868 
这 样 一 来 ,我 们 就 完全 确定 了 先 验 分 布 ITA. 956,2 868) ,假如 随机 抽取 100 
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台 彩 电 进 行 400 小 时 试验 ,没有 一 台 失 效 。 这 时 总 试验 时 间 * = 100 X 400 = 
40 000 小 时 ,r = 0, 于 是 彩电 平均 寿命 96 的 忠 叶 斯 估计 为 
Dp, 2868+s, _ 42868 


5.7.5 贝 叶 斯 区 间 估 计 
对 于 区 间 估 计 问 题 , 贝 叶 斯 方法 比 经 典 方法 更 容易 处 理 。 因 为 在 贝 叶 斯 统 
计 中 参数 9 是 一 个 随机 变量 , 且 有 后 验 分 布 XT(0|x), 这 里 x = (tiasar), 
因此 98 落 在 某 一 区 间 的 概率 是 容易 计算 的 , 辟 如 给 定 区 间 [a,b]j, 用 后 验 分 布 
Xx(0|x) 可 算得 其 概率 ,和 壁 如 为 ] 一 a, Bp 
PU(a<0<blO=1—e (5.7.15) 
反之 , 若 给 定 概 率 1 一 w% 要 求 一 个 区 间 [e , 引 , 使 上 式 成 立 , 这 样 求 得 的 区 间 
Lab] 就 是 2 的 页 叶 斯 区 间 估 计 。 这 是 在 2 为 连续 随机 变量 场合 .假如 2 是 离散 
随机 变量 ,对 给 定 的 概率 1 A MESA. 7.15) 的 a 与 5 不 一 定 存 在 ,这 时 
只 有 略微 放大 (5.7.15) 左 端的 概率 ,才能 找到 a 与 65, 这样 的 区 间 也 是 9 的 页 
叶 斯 区 同人 估计 , 它 的 一 般 定 义 如 下 、 | 
定义 5.7.3 设 参 数 9 的 后 验 分 布 为 x(0|x) .对 给 定 的 概率 1 一 a, 车 存在 
这 样 的 两 个 统计 量 0, = 0,(x) 与 Oy = y(x) ,使 得 
P (0, SO S Ol» >» 1—a (5.7.16) 
则 称 区 间 [6i 00] 为 参数 0 的 可 信 水 平 为 1 一 的 贝 叶 斯 可 信 区 间 ,或 简称 为 8 
的 1 一 “可 信 区 闻 , 而 满足 


P (0 > 0) >1—a (5.7.17) 
的 OL 称 为 2 的 1 一 < 可 信 下 限 , 满 足 
P*(I<0)>=»1-a (5. 7.18) 


的 各 称 为 2 的 1 一 < 可 信 上 限 。 
这 里 的 可 信 区 间 与 经 典 统计 中 的 置信 区 间 是 同类 概念 ,只 是 在 解释 上 不 
同 。 对 可 信 区 间 [ 刀 ,gr] 可 以 说 “2 属于 这 个 区 间 ” 或 “0 落 在 这 个 区 间 ”。 而 对 置 
RKC 0] 不 能 这 么 说 ,因为 经 典 统计 认为 9 是 常量 ,只 能 说 “这 个 区 间 覆 
次 着 9” 或 “这 个 区 间 包 含 0”. 相 比 之 下 ,前 者 的 解释 简单 .自然 , 易 被 人 理解 和 
HH. 
例 $.7. 10 EX X2 X, 是 来 自 正 态 总 体 N(0,0) 的 一 个 样本 ,其 中 
5 已 知 。 正 态 均值 2 的 先 验 分 布 是 N(Cp,r) ,其 中 mr 已 知 。 在 例 5.7.5 中 已 求 
得 0 的 后 验 分 布 为 (ma) ,其 中 
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o HTT T 2 一 2 291 
-PETITZ =o Hr) 
GT agtt?’ ! ' 


其 中 无 为 样本 均值 ,ci = o?/n。 邵 今 要 求 正 态 均 值 6 的 1 一 a 可 信和 多 间 。 

解 : 由 于 9 的 后 验 分 布 为 正 态 分 布 NC(p,o01), 于 是 标准 化 变量 (6 一 m)/0 
服从 标准 正 态 分 布 NO, DAD ua M uia 为 标准 正 态 分 布 的 a/2 和 1 一 
a/2 的 分 位 数 , 则 对 给 定 的 1 一 a 有 


O — 
P| t S a A L uela =1— a 
1 


由 于 正 态 分 布 的 对 称 性 HA Uaz — U1—a/2 o PT LA 
P| p — ou <OS M1 ou ap lx) =1 —a 
AH IX jaj y, 一 OjU7_ajór y 十 OU) -oz 就 是 正 态 均值 9 的 1 一 a 可 信人 区 间 。 
在 儿童 智商 测验 ( 见 例 5.7.5) 中 ,XX~ (0,100) ,0 ~ N(100,225) ,在 仅 
取 一 个 样本 (x = 1) 情况 下 ,算得 一 儿童 智商 0 的 后 验 分 布 为 N (yp,o?) ,其 中 
| 400 + 9x 
Pi 一 2013 ? 
该 儿童 在 一 次 智力 测验 中 得 x = 115 分 ,2 的 贝 叶 斯 估计 为 加 = 110. 38.04 
来 求 8 的 0.95 可 信 区 间 。 由 于 xx = 1. 96 , 故 可 算得 
y 一 oiuo.97s = 110. 38 一 8. 32 X 1. 96 = 94.07 
Hi + oitoers = 110. 38 + 8. 32 X 1. 96 == 126. 69 
该 儿童 智商 0 的 0. 95 可 信 区 间 为 [94. 07,126. 69] ,该 区 间 长 为 32. 62. 

假如 不 用 先 验 信息 , 仅 用 抽样 信息 , 即 仅 用 和 ~ 一 N(9,100), 则 用 经 典 方法 

求 得 的 0. 95 置信 区 间 为 
(115 — 1.96 X 10,115 + 1.96 X 10) = (95. 4,134. 6) 
其 区 则 长 为 39.2, 这 两 个 区 间 估 计 不 同 ,区间 长 度 也 不 同 。 

例 5.7.11 在 例 5.7.9 中 利用 指数 分 布 的 截 昆 样 本 AMECA , 
我 们 获得 了 彩电 平均 寿命 的 后 验 分 布 为 倒 熙 玛 分 布 TP(a 十 +r,4 十 s,), 其 中 
a, MEXICA IDC) 中 的 参数 ,它们 已 由 先 验 信息 确定 :a = 1. 956,4 
= 2868,r 是 截 尾 样 本 中 的 失效 数 ,s, 是 总 试验 时 间 , 它们 分 别 是 > = 0,s, = 
40000 小 时 ,如今 要 确定 彩电 平均 寿命 96 的 0. 90 的 可 信 下 限 。 

解 ,直接 从 6 的 后 验 分 布 获得 其 可 信 下 限 是 困难 的 ,因为 我 们 没有 倒 丁 分 
布 的 分 位 数 表 , 为 此 我 们 通过 变换 把 分 布 转换 到 常用 分 布 上 去 ,下面 两 个 命题 
是 容易 证 明 的 、 

(1) EEIE X ~ ITA, O) X Tay. 


a? = 69. 23 = (8. 32)? 
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(2) FABLE X ~ rla, A), > 0,0 cX ~ rC, àc), 
HARANE GA TAMPA ERA AA 
0t ~Irla +r, +s) 
O lt Tta+rid+s,) (由 于 (1)) 


2(4 十 20 e rio + E =XQle+ rr) (由 于 (2)) 


设 好 so( 是 和 目 由 度 为 了 的 入 分 布 的 0.90 分 位 数 ， 
PQUI+S)0?*< Los ($) = 0. 90 
于 是 可 看 出 ,2 的 0. 90 可 信 下 限 为 
2(4 十 5,) 


DE nf) 


XE f= 2(a 十 rr) 二 2(1.956 十 0 = 3.92. — MR LARA LG) = 
6. 251 ,Xi (4) = 7.779, 用 线性 内 播 法 获 近 似 值 X6.9(3. 912) = 7. 645. FÆ 8 
的 0. 90 可 信 下 限 为 


g, — 2(2 868 + 40 000) 
， = 


7.645 = 11 215( 小 时 》 
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第 JNE OOOO 


假设 检验 


$61 假 投 检验 的 概念 与 步 野 


61.1 什么 是 假设 检验 
统计 推断 的 另 一 类 重要 问题 是 假设 检验 。 下 面 先 通过 一 个 例子 来 说 明 什 


么 是 假设 检验 以 及 如 何 进行 假设 检验 。 

例 6.1.1 某 餐 厅 每 天 营业 额 服从 正 态 分 布 ,以 往 老 菜单 其 均值 为 8000 
元 ,标准 差 为 640 元 。 一 个 新 的 菜单 挂 出 后 ,九天 中 平均 每 天 营业 额 为 8300 
元 ,经 理想 知道 这 个 差别 是 否 是 由 于 新 菜单 而 引起 的 。( 这 里 假定 标准 差 不 
变 。) 

这 一 例子 涉及 两 个 正 态 总 体 :一 个 是 老 菜 单 的 营业 额 ,其 总 体 分 布 为 N 
(pao), 这 里 jw 二 8000,oo 一 640; 一 个 是 新 菜单 挂 出 后 的 营业 额 ,其 总 体 分 布 
I NC) ZEBE c 一 ,但 Ap 未 知 。 现 在 我 们 仅 得 到 后 一 总 体 的 一 个 样 
本 ,其 样本 均值 云 ,可 作为 的 一 个 估计 。 当 互 与 mm 差别 很 小 时 ,就 会 认为 两 
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个 总 体 间 没有 显著 差异 ,而 当 两 者 差别 很 大 时 ,和 壁 如 忒 二 12000 元 , 那 就 很 少 
会 怀疑 新 菜单 的 作用 .可 是 在 很 多 场合 两 者 的 差别 不 那么 明显 时 ,两 个 总 体 间 
是 否 有 显著 差别 呢 ? 假设 检验 将 提供 一 种 方法 , 供 人 们 对 这 一 问题 作出 判断 ， 
这 一 判断 不 可 如 人 免 地 带 有 风险 ,但 这 种 风险 会 受到 控制 。 

假设 检验 的 做 法 分 以 下 几 步 来 叙述 : 

(1) 建 立 假 设 。 | 

为 了 评估 新 菜单 的 好 坏 , 先 要 建立 一 个 命题 “新 老 菜单 的 平均 营业 额 之 间 
没有 差异 ” 这 个 命题 称 为 原 假 设 , 设 为 Ho. 于 是 我 们 的 任务 就 是 要 确认 这 原 
假设 H, 是 真 还 是 假 。 

当 我 们 能 确认 原 假 设 五 ,为 假 时 就 拒绝 豆 。 这 时 我 们 就 面临 如 下 三 个 命 
题 的 选择 ， 

命题 1:“ 新 菜单 的 平均 营业 额 比 老 菜 单 高 ”; 

命题 2,“ 新 汪 单 的 平均 营业 和 额 不 如 老 菜 单 ”， 

命题 3:“ 新 老 菜 单 的 平均 营业 额 之 间 有 显著 差异 ”。 

在 抛弃 原 假设 后 可 供 选择 的 命题 称 为 备 择 假设 , 记 为 H. MPB A 
题 作 为 备 择 假设 要 视 问 题 而 定 。 在 本 例 中 ,和 餐厅 经 理 是 想 知 道 当 前 平均 营业 额 
的 增加 是 否 是 由 于 新 菜单 而 引起 的 ,因而 将 命题 1 作为 备 择 假设 。 

在 本 例 中 ,上 面 所 确立 的 原 假 设 H. 与 备 择 假设 A, 可 以 分 别 用 关于 Aw 的 
等 式 与 不 等 式 表 示 : 

Ho: 48000 
H :p.>8000 

如 采 我 们 拒绝 原 假 设 五 ,就 可 以 认为 万 正确 ,应 该 注意 的 是 五 只 告 
我 们 11>8000, E HI LIJE 8100,8200,… 等 等 。 现 在 由 样本 给 出 去 = 8300, 这 仅 
是 u 的 一 个 估计 而 已 。 

(2) 寻 找 检验 统计 量 ，。 

假设 检验 的 任务 是 要 确认 原 假 设 驴 。 是 否 为 真 。 我 们 的 做 法 是 ; 先 假定 
Ho 成立, 然后 用 样本 去 判断 其 真 伪 。 由 于 样本 所 含 信 息 较 为 分 散 , 因 此 和 需要 
构造 一 个 统计 量 来 做 判断 ,此 统计 量 称 为 检验 统计 最 。 在 本 例 中 可 用 样本 均值 
X 作为 检验 统计 量 。 

在 五 。 为 真 时 ,新 菜单 挂 出 后 ,每 天 营业 额 仍 服从 正 态 分 布 N (8000， 
640). 如今 我 们 获得 了 一 个 容量 为 9 的 样本 ,此 时 样本 均值 仍 服从 正 态 分 布 ， 
其 均值 仍 为 8000 ,而 方差 变 成 
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0 二 -| 44] 一 213. 3” 


LL X—N(8000,213. 32) 。 

在 Ho 为 真 时 ,XX 的 观察 值 三 应 接近 8000, 如 果 工 远离 8000, 那 就 有 理由 
PEA, AR. mó 8300 与 8000 算 近 还 是 算 远 ?或 者 讲 三 要 多 大 才 拒 绝 A? 
这 里 就 需要 一 个 界限 , 记 此 界限 为 c, 当 三 的 值 越过 这 一 界限 就 拒绝 Ho E 
则 就 保留 Ho, BẸ 

当 平均 观察 值 Tc 时 ,拒绝 Hos 

当 平 均 观 察 值 未 <<c 时 ,保留 Ho; 
这 便 是 我 们 的 检验 法 则 的 初 型 ,这 里 的 c 称 为 检验 的 临界 值 ,c 值 的 确定 方法 
下 面 再 讲 。 o 

使 原 假设 Ho 被 拒绝 的 样本 观测 值 (x ,zs，… ,xz,) 所 组 成 的 区 域 称 为 检验 
的 拒绝 域 ,用 W 表示 ;而 保留 原 假设 Ho 的 样本 观测 值 所 组 成 的 区 域 称 为 检 
验 的 接受 (保留 之 意 ) 域 ,用 A 表示 。 在 本 例 中 ,W 与 4 分 别 为 ; 

W= (Ur, 229 "+ an: mc) 

A= {CE1 223" Tr) :ZC) 
Sa AAWA W= {72c}, A={7<c}., 图 6.1.1 HART n=2 时 的 拒绝 域 W 
与 接受 域 4。 由 于 4 与 凤 是 互 斥 的 ,而 其 区 域 之 并 为 样本 空间 Q, 即 为 样本 的 
一 切 可 能 取 值 的 空间 ,因而 只 要 知道 其 中 之 一 即 可 。 在 假设 检验 中 ,人 们 总 是 
关心 拒绝 域 ,这 是 因为 如 今 我 们 手中 只 有 一 个 样本 ,用 一 个 样本 去 证 明 一 个 命 
题 是 正确 的 ,在 逻辑 上 是 不 充分 的 ,但 用 一 个 反例 (如 样本 ) 去 推翻 一 个 命题 ， 
理由 是 充足 的 ,因为 一 个 命题 成 立时 是 不 允许 有 一 个 反例 存在 的 。 当 不 能 否定 
原 假设 Ho 时 ,只 能 将 原 假设 态 。 当 作为 真 的 保留 下 来 。 这 里 保留 的 意思 有 两 点 ， 


Xz 


WwW = 


太一 
2C 


4 +1 


61.1 7? 一 2 时 的 拒绝 域 wW 与 接受 域 4 的 示意 图 
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— H 可 能 为 真 , 二 是 保留 进一步 检验 的 权力 。 

(3) 显 著 性 水 平 与 临界 值 。 

当 我 们 试图 对 原 假设 五 。 是 否 为 真 作 判断 时 有 可 能 会 犯 销 误 ,这 就 是 要 
秆 风险 ,为 了 控制 这 一 风险 ,首先 需要 用 一 个 概率 去 表示 这 一 风险 ,这 个 概率 
便 是 事件 “ 石 , 为 真 但 被 拒绝 ”的 概率 ,这 个 概率 又 称 为 显著 性 水 平 , 记 为 a。 在 
作 判 断 时 我 们 要 尽量 避免 这 一 事件 发 生 ,然而 由 于 样本 的 随机 性 ,要 完全 避免 
是 不 可 能 的 ,因而 只 能 把 这 个 事件 发 生 的 概率 a 控制 在 一 个 很 小 的 范围 内 。 辟 
如 在 本 例 中 取 a=0. 05 ,这 便 意 味 着 

P(Ho 为 真 , 但 被 拒绝 ) 二 0. 05 

这 里 “五 。 为 真 ”表示 样本 实际 是 来 自 总 体 N(8000,640)?,“ 被 拒绝 ”表示 

样本 均值 X >c. 所 以 我 们 可 以 设法 去 决定 < 值 ,使 得 在 H, 为 真 时 > 这 一 


事件 发 生 的 概率 为 0. 05, 这 便 是 用 HH。 为 真 时 下 的 分 布 NC8000, O Ey 


算 > 的 概率 ,使 

P, (X>c3)=0. 05 
由 于 在 H 为 真 时 ,有 1 一 B| 7) 一 0. 05, 从 而 由 正 态 分 布 表 可 知 ， 
c— 8000 


54073 Z L 645, 这 样 我 们 便 定 出 了 临界 值 c 一 8000 十 1. 645 x “一 8350 9, 


A HE E — E TEBA WO. B 6. 1. 2(a) 表 示 总 体 分 布 ,(b) 表 示 样 本 均 
值 X 的 分 布 ,c 即 为 求 出 的 临界 值 。 


总 体 分 布 ! O 


8000 4” 
8300 


6.1.2 临界 值 的 示意 图 
(4) 作 判断 。 
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在 H, 为 真 的 前 提 下 X >8350. 9 这 一 事件 发 生 的 概率 仅 为 0.05, 反 之 叉 
过 8350. 9 这 一 事件 发 生 的 概率 为 0. 95, 前 者 是 一 个 小 概率 事件 。 通 常 在 一 次 
试验 中 小 概率 事件 是 难以 发 生 的 , 倘 知 小 概率 事件 在 一 次 试验 中 发 生 了 ,人 们 
就 有 理由 怀疑 “XX 之 ce” 不 是 一 个 小 概率 事件 。 这 一 牙 盾 导致 人 们 不 相信 原 假设 
Ho 为 真 ,从 而 否定 原 假 设 玉 。。 所 以 我 们 的 检验 准则 为 ; 
当 平 均 观 察 值 z 守 8350.9 时 ,拒绝 Ho; 
当 平 均 观 察 值 二 8350.9 时 ,保留 Ho. 
这 与 我 们 前 面 确定 的 检验 法 则 的 初 型 是 一 致 的 .现在 新 菜单 使 用 了 9 天 ,平均 
每 天 营业 额 2=8300 元 , 它 小 于 8350. 9 元 , 故 应 保留 矿 ,, 即 新 菜单 的 挂 出 对 
平均 每 天 营业 额 没 有 显著 影响 ,至 此 就 回答 了 和 餐厅 经 理 所 提 的 问题 ， 
上 上 面 这 一 例子 说 明了 假设 检验 的 基本 思路 和 具体 步 又。 下 面 再 对 涉及 的 
一 些 概念 作 进一步 的 说 明 。 


6.1.2 假设 

通常 我 们 把 关于 总 体 分 布 的 某 个 命题 作为 假设 。 在 对 总 体 分 布 的 参数 作 
假设 检验 时 , 原 假设 和 备 择 假 设 都 可 看 作 参 数 空间 8 的 某 个 真子 集 @, 50, 
且 这 两 个 子 集 不 能 相交 ,其 并 可 以 是 参数 空间 6 也 可 以 是 @ 的 一 个 子 集 。 这 
时 原 人 

: 0E, H,:0€06, 
如 果 O RODAR 个 天 家 则 称 该 假设 为 简单 假设 ,否则 称 为 复杂 假设 。 
如 例 6.1. 1 F,H, : “一 8000 便 是 一 个 简单 假设 ,而 A, : y> 8000 便 是 一 个 
复杂 假设 。 

原 假 设 与 备 择 假设 的 建立 主要 根据 具体 问题 来 决定 的 。 常 把 没有 把 握 不 
能 轻易 肯定 的 命题 作为 备 择 假设 ,而 把 没有 充分 理由 不 能 轻易 否定 的 命题 作 
为 原 假 设 , 只 有 理由 充足 时 才 拒 绝 它 ,否则 应 予 保留 .譬如 在 例 6. 1. 1 中 ,我 们 
个 慑 肯定 新 菜单 有 作用 ,因而 把 wp>>8000 作为 备 择 假设 ,而 把 a= 8000 作为 
原 假设 。 又 辟 如 某 人 有 一 上 颗 重 23. 1 克 的 钻石 想 拍 卖 ,拍卖 行 的 职工 需要 在 精 
密 天 平 上 将 钻石 反复 秤 重 来 作 判 源 , 由 于 这 时 不 能 轻易 否定 钻石 重量 , 故 可 建 
立 假设 Ho: p=23.1,H, + pe 天 23. 1, 

还 有 一 点 需 注 意 , 这 里 所 讨论 的 假设 与 数学 中 的 假设 含义 是 不 同 的 . 辟 如 
数学 中 “假设 某 函 数 连续 ”, 那 么 我 们 就 承认 这 一 前 提 , 而 这 里 所 讲 的 假设 是 否 
正确 还 有 待 于 我 们 用 样本 去 作 检 验 , 
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6. 1.3 两 类 错误 

在 对 原 假 设 的 真 伪作 判断 时 ,由 于 样本 的 随机 性 可 能 使 判断 发 生 下 面 两 
类 错误 ,其 中 第 一 类 错误 在 前 面 已 提 太 ， 

第 一 类 错误 : 原 假 设 H. 为 真 , 但 由 于 样本 的 随机 性 ,使 样本 观测 值 落 入 
拒绝 域 WW, 这 时 所 下 的 判断 便 是 拒绝 五 ,, 这 类 错误 称 为 第 一 类 错误 ,其 发 生 
的 概率 称 为 犯 第 一 类 错误 的 概率 , 亦 称 为 把 真 概 率 , 它 便 是 前 面 提 及 的 显著 性 
水 平 a。 如 在 例 6. 1. 1 中 ,新 菜单 挂 出 后 实际 上 对 每 天 萌 业 额 无 显著 影 啊 ,在 
是 那 9 天 由 于 婚宴 订 菜 而 使 平均 营业 额 达 到 8600 元 ,由 于 28350. 9, 故 作 
出 把 绝 Ho 的 判断 ,认为 新 亲 捍 对 每 天 营业 和 额 有 显 着 影响 ,这 就 犯 了 第 一 类 错 
Bo 

第 二 类 错误 ; 原 假设 Ho 为 假 , 但 由 于 样本 的 随机 性 ,使 样本 观测 值 落 入 
接受 域 4 ,这 时 所 下 的 判断 为 保留 H 这 类 错误 称 为 第 二 类 错误 ,其 发 生 的 概 
率 称 为 犯 第 二 类 错误 的 概率 , 亦 称 为 取 伪 概率 , 记 为 8。 如 在 例 6.1.1 中 ,新 菜 
单 挂 出 后 实际 上 是 对 每 天 营业 额 有 显著 影响 ,可 是 那 9 天 的 平均 营业 额 仅 为 
8200 元 ,由 于 工 <8350. 9, 故 作出 保留 Ho 的 判 源 ,认为 新 菜单 对 每 天 营业 和 额 
无 显 营 影 啊 , 这 就 犯 了 第 二 类 错误 。 

一 个 好 的 检验 法 则 总 希望 犯 两 类 错误 的 概率 a 与 8 都 很 小 ,但 这 在 一 般 
场合 下 很 难 实现 。 为 此 我 们 再 来 考察 一 下 例 6. 1.1 中 的 a 与 8。 其 总 体 分 布 为 
N (pra?) ,样本 均值 忆 的 分 布 为 NGp, 邱 ), 其 中 为 样本 量 。 在 Ho YAN, y 
一 po 一 8000 ,在 H, 为 真 时 ,不 妨 设 为 =p >8000, FE 
c— Po | 
oJ/N n 


E -< C Mi 
p=P, GZ<o=g E) 


a=P, (X>c)=1-0 (6.1.1) 


(6.1.2) 


AEREA n 和 标准 差 = 国定 时 ,要 使 “小 , 则 从 (6.1. 1) 知 应 使 多 | 大 ， 


HFEA c 的 严 增 函 数 , 故 必要 求 c 大 ,但 从 6.1.2 知 , 当 c 增 大 时 ,8 也 随 
之 而 增 大 。 这 表明 要 使 a 小 必 导 致 8 大 , 若 要 有 小 必 导 臻 ws 大。 所 以 要 使 a 与 
P 同时 小 只 能 增 大 样本 容量 w。 因 而 在 抽取 样本 时 ,尽量 使 样本 容量 大 一 点 ， 
这 对 假设 检验 中 同时 减 小 ec 与 8 是 有 好 处 的 。 
在 一 般 场合 , 当 n 固定 时 , 减 小 a 必 会 导致 增 大 8, 因 此 在 选择 显著 水 平 a 
时 不 应 太 小 , 壁 如 不 宜 取 a==0. 001, 因 为 这 时 虽 可 碱 小 拒 真 概率 ,但 会 大 大 增 
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加 取 伪 概率 。 仍 来 看 一 下 例 6. 1. 1, 若 取 a=0. 001, 则 可 定 出 < 一 8661. 3, 这 时 


车 内 一 8500, 那 么 犯 第 二 类 错误 的 概率 P=P,, A <o =0| PA 


0. 7752, 这 是 无 法 使 人 忍受 的 。 因 而 控制 8 的 一 个 办 法 是 不 使 A A 
a=0. 10,0. 05 和 0.01 JH. 

a 取 多 少 为 宜 还 要 看 检验 问题 的 背景 , 壁 如 在 检验 药品 的 毒性 问题 时 , 毒 
性 过 大 会 导致 病人 中 毒 甚 至 死亡 。 如 果 e 为 药品 毒性 均值 ,建立 如 下 假设 ， 
Ho: Luo H : p> p ,这 时 就 必须 严格 控制 取 伪 概率 8, 这 可 用 增 大 拒 真 概 
率 wa 来 实现 ,在 这 类 问题 中 ,甚至 可 取 w=0. 15 或 0. 20 以 尽量 减 小 6. 这 可 减 
少 病 人 中 毒 死亡 事件 发 生 的 可 能 性 。 

在 复杂 假设 的 场合 ,a 与 8 都 是 未 知 参数 0 的 函数 。 仍 以 例 6.1.1 来 看 ， 
这 时 备 择 假设 E: yx 这 8000, 在 不 同 的 yx 下, 犯 第 二 类 错误 的 概率 8 也 不 同 . 
这 时 可 记 BH RUD: 


CH 
PUD =P, X <c) = =o] S/n 


在 Lo0=8000,n=9,0=640,a=0., 05 时 ,c= 二 8350. 9. 下 面 列 出 了 不 同 的 A 值 对 
应 的 8 值 : 
表 6. 1.1 对 例 6.1.1 435165 (X>8350. 9) ,不 同 4 值 对 应 的 8 值 


p 8 100 8 200 8 300 8 400 8 900 8 600 8 700 
p 0. 8802 0.7601 0.5944 0.4090 0.2423 0.1216 0.0509 


一 般 情况 下 , 若 以 9 表示 分 布 中 的 未 知 参数 ,对 9 作假 设 检验 时 ,可 分 别 记 e、p 
HAD. BO. 


6.1.4 KFH a 的 检验 
检验 就 是 指 判断 准则 。 如 在 例 6. 1. 1 中 ,判断 准则 为 “ 当 平 均 观察 值 ze 
时 拒绝 五 ,” 就 是 一 个 检验 ,有 时 也 可 用 样本 空间 上 一 个 函数 表示 : 
p= Xc 
0, XC 
这 里 x= (a ,x,) 表 示 样 本 观测 值 , 函 数 Xx) 在 拒绝 域 上 取 1， 在 接受 域 
EH 0。 在 一 般 场 合 ,也 可 记 为 ; 
zx)={ ER (6.1. 3) 
O, xcEA 
用 这 种 函数 表示 检验 不 仅 简单 明了 ,而 且 还 可 以 用 它 来 表示 a 与 8, 由 于 eX) 
291 


ESTE, AMA | 
E(X) =P XEW) 
其 中 下 标 0 表示 用 参数 为 9 的 分 布 来 计算 的 。 容 易 看 出 , 当 9€ 8。 时 ， 
PAXEW)=ac0) 
4 026, 时 ， 
P(XEA)=1-—PAXEW)I=P8C0) 
所 以 
ad), dEB, 
g (0) = ECX ) = 1—80), pce 

假如 一 个 问题 中 所 立 的 假设 为 

H,:0<0,, H: >b. 
那么 g(O) 便 是 定义 在 (一 co,co) 上 的 一 个 范 数 ,如 今 我 们 要 控制 犯 第 一 类 和 钴 
误 的 概率 ae, 这 相当 于 要 求 在 入 b 时 ,g(00) 委 ca。 石 一 个 恰 验 p(X) ,使 

g(0)=EPX Sa, 0E O 
则 称 此 检验 是 水 平 为 a 的 检验 。 一 般 来 讲 ,此 种 水 平 为 e 的 检验 不 止 一 个 ,而 
我 们 要 找 的 检验 是 在 一 切 水 平 为 a 的 检验 中 使 犯 第 二 类 错误 的 概率 尽 可 能 小 
的 检验 。 壁 如 在 例 6. 1. 1 中 ， 
1, x8350. 9 
pa 一 | (6.1.4) 
O, x 8300. 9 
是 水 平 为 a=0. 05 的 检验 ,同样 当 c>8350. 9 时 ,如 临界 值 c BLA 8351,8360 
等 , 则 
l, Xc 


plx) = | O, XC 
也 都 是 水 平 为 a==0.05 的 检验 ,因为 此 时 犯 第 一 类 错误 的 概率 不 会 超过 0. 05， 
但 这 一 检验 如 前 所 述 随 者 c 的 增 大 将 会 增 大 犯 第 二 类 错误 的 概率 。 为 使 犯 第 二 
类 错误 的 概率 尽 可 能 小 ,我 们 取 (6. 1.4) 中 的 wx) 作 为 a=0. 05 水 平 的 检验 。 
在 水 平 为 a 的 检验 中 ,我 们 控制 犯 第 一 类 错误 的 概率 不 超过 a, 嗓 在 原 假设 
Ho 为 真 时 ,作出 拒绝 H., 的 概率 得 到 控制 ,这 里 又 一 次 看 到 原 假 设 是 受到 保护 
而 不 轻易 否定 的 ,因而 在 实际 问题 中 常 把 不 能 轻易 否定 的 命题 作为 原 假设 。 


61.5 假 人 检验 问题 的 类 型 
前 面 给 出 了 假设 检验 的 基本 概念 和 具体 步骤 ,但 假设 检验 的 方法 是 多 种 
多 样 的 ,这 要 视 被 检验 的 问题 来 定 。 辟 如 .: 
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(1) 总 体 分 布 是 已 知 的 还 是 未 知 的 。 若 总 体 分 布 已 知 , 只 是 对 其 参数 作假 
设 检 验 ,这 种 检验 被 称 为 参数 检验 , 若 总 体 分 布 未 知 ,这 时 涉及 的 检验 称 为 非 

(2) 总 体 分 布 是 正 态 还 是 非 正 态 。 若 总 体 分 布 是 正 态 的 ,其 参数 的 假设 检 
验 问 题 已 有 较为 成 熟 的 检验 法 则 ,车 总 体 分 布 己 知 但 非 正 态 , 那 就 需要 一 个 一 
个 地 讨论 与 解决 ,没有 一 般 方法 可 言 。 

(3) 当 总 体 含 有 多 个 参数 ,除了 要 检验 的 参数 外 , 其 余 参 数 是 已 知 还 是 未 知 。 

(4) 备 择 假设 五; 的 选取 涉及 拒绝 域 的 形式 是 单 边 的 还 是 双边 的 。 如 例 
6.1.1 中 拒绝 域 形式 为 W== (23>0) ,这 种 检验 称 为 单 边 检 验 . 如 果 拒 绝 域 形 式 
为 W=(T(O<c RTS) ,这 种 检验 称 为 双边 检验 ,这 里 了 (xz) 是 检验 
用 的 统计 量 。 

(5) 样 本 量 的 大 小 。 用 大 样本 的 检验 称 为 大 样本 检验 ,这 时 需 用 到 检验 统 
计量 的 极限 分 布 ,用 小 样本 的 检验 称 为 小 样本 检验 ,这 时 需 用 到 检验 统计 量 的 
精确 分 布 或 近似 分 布 。 

(6) 涉 及 总 体 个 数 , 如 例 6.1.1 只 是 涉及 新 菜单 挂 出 后 每 天 营业 额 的 分 
布 , 因 而 只 需 抽 取 一 个 样本 ,这 是 单 样本 的 检验 。 当 涉及 两 个 总 体 的 分 布 或 参 
数 比 较 时 ,就 需要 两 样本 的 检验 。 有 时 还 会 涉及 更 多 总 体 的 比较 ,第 七 章 所 讲 
的 方差 分 析 将 涉及 多 个 样本 的 检验 。 

例 6.1.2 某 厂 制 造 的 产品 长 期 以 来 不 合格 品 率 不 超过 0. 01, 某 天 开工 
后 ,为 检验 生产 过 程 是 否 稳定 ,随机 抽检 了 100 件 产品 ,发 现 其 中 有 2 件 不 合 
格 品 。 试 判断 该 厂 生 产 是 否 稳定 。 

Eat X 为 抽检 一 件 产 品 中 不 合格 品 的 件数 , 则 扎 服 从 二 点 分 布 5(1， 
0) ,其 中 0 为 产品 的 不 合格 品 率 ,0 过 9 过 1, 当 生 产 稳定 时 IO. 01, 当 生产 不 稳 
定时 9>0. 01。 因 此 判断 该 天 工厂 生产 是 否 稳定 可 转化 为 检验 如 下 假设 : 

Ho: 0<0.01,  H,:06>0.01 
这 是 一 个 离散 总 体 参 数 的 单 边 检 验 问 题 ， 
检验 用 的 统计 量 常 可 以 从 6 的 估计 出 发 去 寻找 ,在 这 个 例子 中 9 的 估计 


YI X= LX 作为 检验 统计 量 ,在 ” 确定 时 ,也 可 以 用 了 一 


Xi. 当 H, 为 真 时 ,各 不 应 过 大 , 即 工 不 会 过 大 ; 当 Ho 不 真 时 , 叉 较 大 , 即 
T 会 取 较 大 的 值 。 因 而 当 抽 取样 本 后 ,可 以 根据 了 的 值 来 下 判断 , 当 芽 之 c 时 
认为 Ho 不 真 , 故 拒绝 域 为 如 下 形式 
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W=iT=c) 
这 里 c 是 临界 值 ， 
为 在 给 定 了 了 显著 性 水 平 a 后 确定 c 的 值 , 先 来 看 一 下 荆 的 分 布 。 当 XX~ 


b(1,0) ,样本 和 了 了 一半 忆 一 59), 从 而 犯 两 类 错误 的 概率 分 别 是 9 的 函数 
«(0) = mazo D| 1] pa- 9), 0<9<O. 01 


8(0) = PoT<o= 马 | ojoa-- gyo- 0,0]<9<1 


下 表 列 出 了 若干 06 值 下 ,不 同 c 对 应 的 a(9) 与 8(0) 的 值 : 
表 6.1.2 M6.1.2 中 对 不 同 的 c 值 给 出 的 若干 a(8) ,B00) 


c 1 2 3 4 5 6 
alo. 005) 0. 394 0. 090 0.014 0. 002 0. 0002 0. 00001 
a(0. 01) 0. 634 0. 264 0.079 0. 018 0.003 0.0005 
BCO. 04) 0. 017 0. 087 0.232 O. 429 0.629 0.788 
BCO. 08) O. 0002 0. 002 0.011 0. 037 0.090 0.180 


由 这 几 个 值 上 可 见 ,对 固定 的 c, 在 60.01 时 ,a(9) 随 9 的 增 大 而 增 大 ;在 0 
0. 01 RF, BCO BERE 9 的 增 大 而 减 小 ,所 以 在 0<O. 01 时 ,可 选择 0=0. 01 时 
满足 aC0) <a 的 c 即 可 ;又 从 上 表 可 见 , 对 固定 的 0>0.01, M8 c 的 增 大 ， 
8(9) 也 将 增 大 。 因 此 应 选取 使 a(0.01) 志 a 时 对 应 的 最 小 的 < 值 ,即使 
a(0.01) 夺 a 又 最 徘 近 a 的 那个 c 值 ,以 控制 犯 第 二 类 错误 的 概率 。 综 上 ,在 “= 
0. 01 时 ,可 取 临 界 值 c==3, 从 而 拒绝 域 为 


w=[))2>3) 


当 由 样本 观测 值 知 不 合格 品 数 不 少 于 3 个 时 拒绝 Ho AR 3 个 时 保留 Ho M 
在 由 样本 得 了 =2 落 在 接受 域 中 , 故 保留 鼠 ,, 即 认为 该 天 生产 稳定 。 


$62 正 态 总 体 参 数 的 假设 检验 


正 态 分 布 NC, ) 是 常用 的 分 布 ,关于 e5 e 的 有 关 检 验 也 是 实际 中 党 
常 遇 到 的 ,下 面 分 几 种 情况 加 以 讨论 。 
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6.2.1 关于 均值 的 检验 

设 样本 从 1 ;人 >) 来 目 正 态 总 体 N (uso) ,样本 均值 为 六 ,样本 的 无 
WIEN 5S’, 现 要 考虑 关于 均值 e 的 检验 问题 。 

6.2.1.1 o 已 知 的 情况 

根据 原 假设 Ho 与 备 择 假设 H WAR ,分 别 加 以 考虑 : 

(1) 单 边 假设 检验 问题 。 

考虑 检验 问题 

Ho: AS po» Hi: 4> ko (6.2.1) 

这 里 jw E PENA. : 

由 于 第 用 六 来 估计 ,因而 取 允 作为 检验 统计 量 。 相 对 于 备 择 假 设 H, 
来 讲 , 当 原 假设 Ho HAR, X PARR, X 过 大 时 ,应 拒绝 Ho, A MEAR 
有 如 下 形式 : 


W = { (z; 2 $ Tn) TC} 


其 中 c 为 待定 的 临界 值 。 
由 于 灵 ~N |a| , 故 犯 第 一 类 错误 的 概率 为 
aly) =P (X>0)=1— -g| E). UŠ Mo 


在 <p Bra DA w 的 严 增 函 数 , 故 其 最 大 值 在 u= u 处 达到 ,从 而 对 给 定 
a 要求 c 满足 


1-0 | —a 
N =m 即 临界 值 
c= ue 
从 而 得 拒绝 域 为 
W= | (raza) > 天) (6.2. 2) 


(6.2. 2) 也 可 写成 另 一 种 形式 : 


W= | (Lis Ez," Tan) U = WE >u) 


亦 可 取 
295 


_ X-k 

on 
为 检验 统计 量 ,zx AU) AEREA A W= (a das 000 10): 4 2 
u1_a) ,今后 简 记 作 


(6. 2. 3) 


W = {u Zuia) (6.2.4) 
以 后 称 以 U 作为 检验 统计 量 的 检验 为 U 检验 。 
例 6.2.1 微波 炉 在 炉 门 关闭 时 的 辐射 量 是 一 个 重要 的 质量 指标 。 某 厂 
该 指标 服从 正 态 分 布 N(x,a), 常 期 以 来 o==0.1, 且 均值 都 符合 要 求 不 超过 
0. 12。 为 检查 近期 产品 的 质量 ,抽查 了 25 台 ,得 其 炉 门 关 闭 时 辐射 量 的 均值 式 
二 0.1203。 试 问 在 a=0.05 水 平 上 该 厂 炉 门 关 闭 时 辐射 量 是 否 升 高 了 ? 
解 : 首 先 建立 假设 。 由 于 长 期 以 来 该 厂 wk 和 0. 12, 故 将 其 作为 原 假设 ,有 
Ho: 1<0.12, H,:p>0. 12 
在 a=0. 05 时 ,zs 一 1. 645 ,拒绝 域 应 为 {4 宇 1. 645}。 现 由 观测 值 求 得 
”0. 1203 一 0. 12 
”0.1/V25 
因而 在 a=0.05 水 平 下 ,不 能 拒绝 五 ,, 即 认为 当前 生产 的 微波 炉 关 门 时 的 辐 
射 量 无 明显 升 高 。 
男 一 种 类 型 的 单 边 检 验 问 题 是 


=0. 010<1. 649 


Ho:p>p ， H¡:p<po (6.2.5) 
EH, ER Ce. 2. 3) 为 检验 统计 量 , 则 拒绝 域 应 改 为 
W=(u<Xua) (6.2.6) 


因为 根据 五 ; TA, Y X BEAR Ho AO E ARA 
a) =P, Xc) = o| W <E), © ph 
这 是 u 的 严 减 函数 ,在 u= p 时 取 最 大 值 ,因而 可 要 求 


C — ffo E 
Panl 
从 而 由 和 (0,1) 的 分 位 数 知 jw c= mu * -到 ,由 于 中 过 jo 十 
“ -天 等 价 于 U= Sa , 故 (6. 2. 6) 是 检验 问题 (6. 2. 5) 的 水 平 为 a 
的 检验 的 拒绝 域 ， 


例 6.2.2 某 厂 生产 需 用 玻璃 纸 作 包装 , 按 规 定 供 应 商 供应 的 玻璃 纸 的 
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横向 延伸 率 不 应 低 于 65。 已 知 该 指标 服从 正 态 分 布 Nu), 一 直 稳 定 于 
5. 5。 从 近期 来 货 中 抽查 了 100 个 样品 ,得 样本 均值 王 =55. 06 ,试问 在 a=0. 05 
水 平 上 能 否 接 收 这 批 玻 璃 纸 ? 
解 : 由 于 若 不 接收 这 批 玻 璃 纸 需 作 退货 处 理 , 这 必须 慎重 , 故 取 pw<<65 作 
为 备 择 假设 ,从 而 所 建立 的 假设 为 
Ho:4»65,  H:u<65 
在 a=0.05 时 ,xs 一 一 1.645, 拒 绝 域 应 取 作 {w 委 一 1.645}。 现 由 样本 求 得 


oo ES 645 
故 应 拒绝 五 o, 不 能 接收 这 批 玻 璃 纸 。 
(2) 双 边 假 设 检验 问题 。 
考虑 检验 问题 
Ho: H= Mo» Hi; nA (6. 2. 7) 


仍 可 取 (6. 2. 3) 作 为 检验 统计 量 。 由 于 相对 于 H, 来 讲 , 当 H EX 5 w 
不 应 相差 过 大 , 故 拒绝 域 形 为 {|z 一 jy | 之 c}, 由 于 在 H 中 仅 含 一 个 参数 值 ， 
故 要 使 犯 第 一 类 错误 概率 不 超过 a, 只 要 P, (| 及 一 jw | 之 c) =a 即 可 ,这 等 价 


ES u ET, ATR 


/= 
(6. 2. 7) 的 水 平 为 a 的 检验 的 拒绝 域 为 
W=(lu|>u-2) (6. 2. 8) 
例 6.2.3 某 洗涤 剂 厂 有 一 台 瓶 装 洗 洁 精 的 灌 装 机 ,在 生产 正常 时 ,每 瓶 
洗 洁 精 的 净重 服从 正 态 分 布 ,均值 为 454g ,标准 差 为 12g。 为 检查 近期 机 器 工 - 
作 是 否 正常 ,从 中 抽出 16 瓶 , 称 得 其 净重 的 平均 值 为 二 =456. 645。 试 对 机 器 
工作 正常 与 否 作出 判断 。( 取 a=0.01, 并 假定 o RÆ.) 
解 :这 里 需 检验 的 假设 为 : 
Ho: p=454 H,:p7454 
在 a=0. 01 EJ ,u1-£=u0. 995 = 2. 58, AMIRA lu |22. 58), 现 由 样本 求 得 
_ 456. 64—454 
CO 12/716 
由 于 jx|<2.58, 故 不 能 拒绝 有 右 ,, 即 认为 机 器 正常 。 | 
前 面 已 提 到 在 建立 假设 时 并 不 要 求 Bo 50, 之 并 为 6, 辟 如 检验 问题 
如 oo: 一 Am 人:A>>Am, 其 水 平 为 “的 检验 的 拒绝 域 仍 为 (6. 2.4); 同 理 , 检 验 问 
题 Ho: p= pH: p< po HAM A a 的 检验 的 拒绝 域 仍 为 (6. 2. 6) 。 检验 的 拒 
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=0. 88 


绝 域 的 形式 由 五 ; 决定 ,而 临界 值 实际 上 是 由 == 0 时 上 U 的 分 布 所 决定 的 ,在 
u= m 时 ,U = ~N (0,1), EEHEHE RCG. 2. 4) 中 的 临界 值 为 i-as fE Æ 


X — Po 
s/n 
域 (6. 2. 6) 中 的 临界 值 为 wo, 拒绝 域 (6. 2. 8) 中 为 uita 
图 6.2.1 中 给 出 了 不 同 备 择 假 设 、 拒 绝 域 和 显著 性 水 平 。 


(a) H,: H>lo 

阴影 面积 =a 
(b) Hi: U< Ho u 

拒绝 H, 

— Hia 
总 的 阴影 面积 =a 
阴影 面积 w/2 / N 阴影 面积 2/2 

(c) H,: 4X%Uy 


0 
= Ur a72 Uia? 


拒绝 H, 拒绝 H, 


”” 《图 中 曲线 为 N (0,1) 的 密度 函数 曲线 》 
图 6.2.1 备 择 假设 ,拒绝 域 和 显著 性 水 平 
6.2.1.2 未知 的 情况 
可 同样 考虑 前 面 提 到 的 三 个 检验 问题 : 


CHo: uS po 9 H: H> ho (6.2.1) 
(2H: HÈ Mo , Hi: p< mo | (6.2.5) 
《3) 豆 op 一 Hp ») Hi: KÆ to (6.2.7) 


但 现在 不 能 用 U 作为 检验 统计 量 , 因 为 它 含 有 未 知 数 参 数 o, 一 个 自然 的 想法 

是 用 e 的 无 偏 估计 S 去 取代 o2, 采 用 统计 量 

:= (6.2.9) 
S/N n 


对 检验 问题 (6. 2. 1) 来 讲 , 其 拒绝 域 为 
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中 AA TIA EU SR lO IE A Pl gg APT II a 


W = { (zi Tas” » Ta) tc) 
HH c 应 满足 
al) =P, (> cia y uX ho 
入 一 pn 


TÁ u= po 时 i : =, -ho .dd 
已 在 u= p 时 达到 最 大 ,这 是 因为 对 固定 的 A 而 言 : S/n ot 


PTh Xp , 当 记 Fa) 1 
SI ET i(n 一 1), 当 记 (z) 为 自由 度 是 的 上 分布 的 


分 布 函 数 时 ,有 
— — Xp 一 
“= Prt) TP E> S/n 
=1—Fin-1) EZ , PS po 


当 A a GORRA TE pr 一 mm 处 达到 最 大 , 故 只 要 取 a o), 而 在 u= 
uo 时 ,~ 上 Cn 一 1)， 从 而 < 一 和 (2 一 1)。 所 以 检验 问题 (6. 2. 1) 的 水 平 为 a 的 检 
验 的 拒绝 域 为 


W = (t>t1-.(n—1)) (6. 2.10) 
对 检验 问题 (6. 2. 5) 与 (6. 2. 7) 来 讲 , 水 平 为 a 的 检验 的 拒绝 域 分 别 为 
W= (t<t.(n—1)) (6. 2.11) 
及 
W= (ls|>+t,-<(n—1)) (6. 2.12) 


称 以 (6. 2. 9) 为 检验 统计 量 的 检验 为 上 检验 ， 

例 6.2.4 根据 某 地 环境 保护 法 规定 , 倾 入 河流 的 废水 中 某 种 有 毒化 学 
物质 含量 不 得 超过 3ppm 。 该 地 区 环保 组 织 对 沿 河 各 厂 进行 检查 ,测定 每 日 倾 
入 河流 的 废水 中 该 物质 的 含量 。 某 厂 连日 的 记录 为 

3.1 3.2 3.3 2.9 3.5 3.4 2.5 4.3 

2.9 3.6 3.2 3.0 2.7 3.5 2.9 
坛 在 显 着 性 水 平 a==0.05 上 判断 该 厂 是 否 符 合 环保 规定 (假定 废水 中 有 毒物 
质 含 量 Xx—N(u6w0)), 

解 : 为 判断 是 否 符合 环保 规定 ,可 提出 如 下 假设 : 
五 :HL 安 3 ， Hi:M>3 
由 于 这 里 c 未知, 故 采 用 上 检验 ,现在 x 二 15, 在 a==0.05 时 如 si(14) 一 1. 7613, 
故 拒 绝 域 为 
(2>1. 7613) 
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现 根据 样本 求 得 去 =3. 2,5=0. 436, 从 而 有 
o 2—3 | 
二 4467 十 1.7766>1. 7613 
样本 落 入 拒绝 域 ,因此 在 a=0. 05 水 平 上 认为 该 厂 废水 中 有 毒物 质 含量 超标 ， 
不 符合 环保 规定 ,应 采取 措施 来 降低 废水 中 有 毒物 质 的 含量 ， 


综 上 ,将 关于 正 态 总 体 均 值 检 验 的 有 关 结 果 列 在 表 6. 2. 1 中 以 便 查 找 。 
表 6.2.1 正 态 总 体 均值 的 假设 检验 


(显著 性 水 平 为 a) 
| po (UU ye] 
URE | oc 已 知 | um PESO 
H= Ho (Jul >u} | 
up itztian—1)) 
t 检验 5 未 知 | =p italian —1)) 
u= Mo (lel >t-<(n>1)) 


6. 2. 2 ”关于 方差 的 检验 
设 样本 XXX 来 自 正 态 总 体 NC r) EEEN X, EEN 
MIEN S ,现在 讨论 jy 未知 时 关于 方差 o 的 检验 问题 。 
6.2.2.1 单 边 假设 检验 问题 
首先 考虑 检验 问题 
Ho <o, H,:0%>07 (6. 2. 13) 
其 中 o 为 一 正 的 常数 。 O HERA IES? 去 估计 ,考虑 到 H, , 则 拒绝 域 应 为 
W = {rT tn is 0) 
考虑 检验 统计 量 
(DS 
由 于 5 > 这 一 事件 等 于 X 之 c* ,c' 为 临界 值 ,待定 。 此 时 犯 第 一 类 错误 的 概 
率 


x = (6. 2. 14) 


al) =P > O, Lo 
这 是 的 严 增 函 数 , 这 可 从 下 面 看 出 。 若 以 Fo uv(Gz) 记 自由 度 是 2 一 1 的 和 2 
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f 


mn. 
+ A 


(n—1)5* 


g? 


AMI MAA A A t E P (P<), A —Y(n— 1), MM X 


ala?) = P(X Ec ” 


2 
=P € 135 
O 


E 
g 
当 g? HKH alo) HARK, AEE =o a aD ARREK., MAA EA 
HEKE a, 只 要 在 co 一 ai 时 ,ak(ci) =a, BAM X~ DAM AE c* = 
Xi—(n— i). 

综 上 ,对 检验 问题 (6. 2.13) ,可 用 (6. 2.14) 作 为 检验 统计 量 , 水 平 为 a 的 
检验 的 拒绝 域 为 


. 0% 
之 C o? =] — F ga- 


W= {X 之 Xis(n 一 1)) (6. 2. 15) 
同 理 ,对 另 一 单 边 检验 问题 
H: 2o, H <o (6. 2. 16) 
仍 可 用 (6. 2. 14) 作 检验 统计 量 ,此 时 水 平 为 a 的 检验 的 拒绝 域 为 
W=(<X(n-D) (6. 2.17) 


6. 2. 2.2 ”双边 假设 检验 问题 
H,:0*=0f%, H: £0 
仍 可 用 检验 统计 量 (6. 2. 14) ,此 时 拒绝 域 为 
W= (XXi ln DR SXi- Cn 1)} (6. 2. 18) 
称 以 (6. 2. 14) 为 检验 统计 量 的 检验 为 X 检验 。 
将 关于 正信 总 体 方差 检验 的 有 关 结 果 列 于 表 6. 2. 2 中 以 便 查找 ， 


表 6.2.2 正 态 总 体 方 标的 假设 检验 


(显著 性 水 平 为 a) 
Ho | ><. za (n—1) 


<a 
0 


Ea —D) 
E (m— DIE 
XXi- (n—1)) 


CRE 


例 6.2.5 某 种 导线 的 电阻 服从 Nm,o2), 未 知 ,其 中 一 个 质量 指标 是 
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电阻 标准 差 不 得 大 于 0. 005Q。 现 从 中 抽取 了 九 根 导线 测 其 电阻 , 测 得 样本 标 
准 差 ;一 0. 0066 ,试问 在 a=0. 05 水 平 上 能 否认 为 这 批 导 线 的 电阻 波动 合格 ? 
解 :首先 建立 假设 
Ho:o<0. 005, H,:0>0. 005 
这 是 一 个 单 边 检验 AE n= 9,0 =0. 05 时 ,X?.95《8) 二 15. 507 ,拒绝 域 为 
W=(xéí=>15. 507) 
现 由 样本 求 得 


2_ 8X0. 0066’ 
0. 005? 


故 可 接受 原 假设 ,在 a 二 0.05 水 平 上 认为 这 批 导 线 的 电阻 波动 合格 。 


=13. 94<15. 507 


62.3 ”关于 两 个 正 态 总 体 方差 的 检验 
EMES DAE X ~N (p ;01) 中 获得 样本 Xp Az)” X HR IE E tE 


本 无 偏方 差分 别 记 为 X, Sk MBESA Y —N (jw,o?) 中 获得 样本 YY,， 
Y, qn” ,YYn，, 其 样本 均值 与 样本 无 偏方 差分 别 记 为 Y、.S*, 且 两 个 样本 独立 。 
这 里 假定 mm 未 知 ,考虑 有 关 方 差 大 小 的 检验 问题 。 
先 考虑 单 边 检验 问题 : 
Ho:0í<o, Hi:o >o? (6. 2.19) 
也 可 将 上 述 检验 问题 记 为 ， 
m:É<, MUS (6. 2.20) 
0; 0% 
由 于 常用 Si 5 SMA o S a Am A EALE 5S% 与 $$ 的 大 
小 来 判断 。 现 考虑 统计 量 
ry (6. 2. 21) 
考虑 到 五, 因而 可 取 拒 绝 域 为 
W= { (X19 Te s**t Tns 19V29 sYm) Fc} 
c 为 临界 值 ,待定 。 
Si/% 07 , 
EE e 与 o2» 38 /大 一 下 . e Fm 1,m=1), it Ffa- (Zz) 为 
目 由 度 是 一 1,m 一 1 的 下 分 布 的 分 布 函 数 , 则 犯 第 一 类 错误 的 概率 为 ， 
Si/0% o? 


rr 


€ $ 
2 /2 -一 
Sy /Gy g? 


[对 =P (F >c)=P 
Qa pr: — pd Y 一 
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=1—Ftc + Zo, Z<] 
91 1 
它 是 对 的 增 函数 , 它 在 区 一 1 时 达到 最 大 , 故 只 要 e(1) 一 “ 便 可 得 水 平 为 的 


检验 的 拒绝 域 。 在 人 二 1 时 FE=F(n—1,.m—1),% c=F ¡_¿(n—1)m—1). 从 
而 检验 问题 (6. 2. 19) 的 水 平 为 a 的 检验 的 拒绝 域 为 


W= (FF, .(n—1)m—1); (6.2. 22) 
同 理 可 得 检验 问题 
Ha: zé, H,:0<o (6. 2. 23) 
5 e 
Ho:0=0%, H,:0%07 (6. 2.24) 
的 水 平 为 a 的 拒绝 域 分 别 是 
FSXF.n—1)m—1)) (6. 2.25) 
与 


FESF2(1—1,m— DE F>F,¡-<(n—1,m—1)) (6. 2. 26) 
用 (6. 2. 21) 作 检验 统计 量 的 检验 称 为 已 检验 。 有 关 结 果 列 于 表 6. 2. 3。 


表 6. 2.3 两 个 正 态 总 体 方 问 的 假设 检验 
(ma 未 知 , 显 着 性 水 平 为 a) 


检验 法 检验 统计 量 拒绝 域 


(PF «(n—1im-—1)) 
(FEFSF.rn—1m—1)) 
{ 开 入 7 (n 一 1,m 一 1) 或 


F>F1-<(n-1)m—1); 


例 6. 2.6 甲乙 两 台 机 床 分 别 加 工 某 种 轴 , 轴 的 直径 分 别 服从 正 态 分 布 
Nanyo) 与 NGCa ,ac) ,为 比较 两 台 机 床 的 加 工 精 育 有 无 显著 差异 。 从 各 自 加 
工 的 轴 中 分 别 抽取 若干 根 轴 测 其 直径 ,结果 如 下 ( 取 a=0. 05): 


TEET 直径 


XAR) 8 20.5 19.8 19.7 20.4 20.1 20.0 19.0 19.9 
7( 机 床 乙 ) 7 20.7 19.8 19.5 20.8 20.4 19.6 20.2 
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解 : 首 先 建立 假设 : 
Ho:01= 02,， 五 :ai 天 cr 


Eros (7,16) = == .0.195, Fo.9757 6)=5. 70 


故 拒绝 域 为 

{F<0. 195 或 下 之 5. 70) 
现 由 样本 求 得 六 二 0. 2164,54 =0. 2729, 从 而 下 二 0.793, 未 落 入 拒绝 域 ,因而 
在 a=0. 05 水 平 上 可 认为 两 台 机 床 加 工 精度 一 致 。 


62.4 ”关于 两 个 正 态 总 体 均值 差 的 检验 

如 同 6. 2. 3 中 所 述 的 两 个 样本 ,讨论 有 关 均 值 大 小 的 检验 问题 .分 几 种 情 
况 讨 论 。 

6.2.4.1 o 50, 已 知 的 场合 


完 考 虑 假设 检验 问题 
Hi: mp» H; : 4a > Hz (6. 2. 27) 
这 相当 于 考虑 检验 问题 ， 
Ho: Mp0, 瑟 :同一 /0 (6. 2. 28 ) 


由 于 可 用 X SY RAAT jp 与 ,因而 考虑 到 已 :, 取 拒绝 域 形 为 
W= 4 Cx sion s Ens Y1 9 Y23937 s Ym): T — YC) 
其 中 c 是 待定 的 临界 值 。 
HF X-Y~N| mm 4 
决定 


; 故 对 给 定 的 显著 性 水 平 a,c 应 由 下 式 


at — Hz) =P (X—Y >c} 


+ 


n m 


C 一 (HI 一 Aez) 
=1-—0Q di 0% <a, p1— 20 


考虑 到 a(jpa 一 px) 在 pm 一 jw=0 时 达到 最 大 值 , 故 可 取 一 一 == e. Bf c= 
of o? 
一 十 一 


um A ARE 6. 2. 1 中 的 考虑 , 取 检验 统计 量 为 
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a sd Sn 


U = (6. 2. 29) 
E 
n m 
| 2 2 
EA {T yua . E 
W = {u Zua} (6. 2. 30) 


从 而 检验 问题 (6. 2.27) 的 水 平 为 a 的 检验 拒绝 域 为 (6. 2.30). 
同 理 可 得 检验 问题 


Ho: mps H: 41 <p (6. 2. 31) 
与 
Ho: p= Hz, Hı: M7 ho (6. 2. 32) 
的 a 水平 的 拒绝 域 分 别 为 
W = {u Sua) (6. 2. 33) 
5 
W= (lu | >u1-2) (6. 2. 34) 


也 称 用 统计 量 (6. 2. 29) 的 检验 为 U 检验 。 
6.2.4.2 01 ,0, RA, Ho =o: 的 场合 
在 这 种 场合 , 记 0=0=0",0 可 用 
(n—1)S7+ (m— 15; 
n+m-—2 


S = 


去 估计 ,采用 检验 统计 量 


(6. 2. 35) 


;二 一 二 (6. 2. 36) 


Swa + 
7 


3 |= 


其 中 Sw 二 VS。 
仍 考虑 检验 问题 (6. 2. 28) ,此 时 拒绝 域 { 云 一 yc} 中 的 c 可 由 下 式 决定 、 
al 一 po) 一 到 人 元 一 7C 


(X—Y)— 42) c— (ft — H) 
=] — P 1,1 =0 y 后 一 上 入 0 


Swa 4+4 Sv 
n 774 n 774 


ag Ai — pH = O 时 ,达到 最 大 值 ， ME a = mm H,t—t(a+m— 2), $ 9] EX 
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= ne(a+m—2), B] c=t mim 295 一 十 二 ,从 而 拒绝 


域 为 {一 yon 十 m 一 2)Sw。 人 /十 十 二 } ,这 等 价 于 


W= {tti (ntm—2)} (6. 2. 37) 
同 理 可 得 检验 问题 (6. 2. 30506. 2. 32) 的 水 平 为 a 的 检验 的 拒绝 域 分 别 为 
W = (<t,(n+m>—2)) (6. 2. 38) 

与 
W=(le]>t-2(n+m—2)) (6. 2. 39) 


也 称 以 (6. 2. 36) 为 检验 统计 量 的 检验 为 上 检验 。 

例 6.2.7 设 例 6. 2.6 中 两 台 机 床 加 工 的 轴 是 同类 的 ,其 直径 分 别 服从 
正 态 分 布 , 经 例 6. 2.6 的 下 检验 已 确认 其 方差 相等 , 即 认 为 甲乙 两 台 机 床 加 
工 的 直径 分 别 服从 NN (yay) 与 NCp,0), 现 进一步 检验 两 台 机 床 加 工 的 轴 
的 平均 直径 是 否 一 致 ( 取 a=0. 05)。 

解 :对 此 问题 相当 于 检验 

Ho: p1 = Hs AH: pr 
由 于 两 总 体 方差 一 致 但 未 知 , 故 用 统计 量 (6. 2. 36) ,在 n=8,m=7,a=0. 05 
EF ,zo 975013) 二 2.1604, 从 而 拒绝 域 为 
{1t| 守 2. 1604) 

M h Ek z= 19. 295, y= 20. 143, sy = 0. 2425, sw = 0. 4924, W) £ = 
—0. 8554, HF |t| <2. 1604, 故 可 认为 在 a=0. 05 水 平 上 ,两 台 机 床 加 工 的 轴 
的 平均 直径 一 致 

6.2.4.3 0 与 cs 未 知 的 一 般 场合 

这 里 给 出 两 种 近似 检验 方法 ， 

Da 与 m 不 太 大 时 : 


Xx HH X~ wa. A),p- N | m Ž i), 且 两 者 独立 ,从 而 区 一 了 一 
Ti 
(X —Y)— (a — 19) 


2 2 
di do 
ay 
n 71 


N py 10 y E 
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当 有 与 有 分 别 用 其 相合 估计 Sk Si 代替 后 , 记 
_ (X—Y)— (41 p) (6. 2. 40) 
S% Si 


这 时 z* 就 不 再 服从 NC0,1) 分 布 了 ,其 形式 很 象 1 统计 量 。 因 此 人 们 就 设法 用 
t 统计 量 去 拟 合 ,结果 发 现 A 


a 2 
l 非 整 数 时 取 最 接近 的 整数 , 则 z* 近似 服从 目 由 度 是 的 :分 布 , 即 万 一 4)， 
于 是 可 用 z* 作 为 检验 统计 量 ,对 如 下 三 类 检验 问题 
(1)Ho: t — 130 H: 4a — 1>0 
(2)Ho: pı — 220 Hi: pı p0 
(3H o: p1—p2=0 Hı: 4 p£ 


1* 


的 拒绝 域 分 别 为 
Wi= {rT Tn) 7 tiall) 
Wo=1 (2129 En): t" <t 1) ) 
全 一 人 (zy le” | =t1-2 (13) 


(2) 当 与 m 较 大 时 ， 
313 m 较 大 时 ,(6.2.41) 式 中 的 ! 也 将 随 之 而 增 大 ,我 们 知道 , 当 1>30 
时 ,自由 度 为 7 的 :分布 就 很 接近 于 正 态 分 布 N(0,1), 故 在 2” 与 mx 较 大 时 ,我 
们 将 (6.2.40) 中 的 :* 改 记 为 UU, 并 认为 U 近似 服从 NC(0,1) 分 布 ,对 上 述 三 类 
检验 问题 分 别 采 用 拒绝 域 ， 
Wi= lu=u;-a) 
W= (u<=us) 
W= | lu (u-t) 
例 6.2.8 设 甲乙 两 种 矿石 中 含 铁 量 分 别 服从 NG 005 Nn, 0), 
现 分 别 从 两 种 矿石 中 各 取 者 干 样品 测 其 含 铁 量 ,其 样本 量 .样本 均值 和 样本 无 
偏方 差分 别 为 ， 
HA :m=10,7=16.01,5%4=10. 80 
A :m=5,y7=18. 98,57 =0. 27 
RE 00.01 KFE ,检验 下 述 假设 : PTASREAMT LO AMAR. 
解 :这 里 的 检验 问题 为 
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Ho: p1 ÈH Hi: 4 <k 
由 于 这 里 n,m 都 不 大 , 且 5 HAER. AMRA G. 2. 40O H t 统计 
量 作 检验 。 此 时 


Į = 


2 212 jf 4 4 
这 + 于 | / | 一 9.87 


n m n(n—1]1)  mGn—1) 
此 时 可 取 与 其 最 接近 的 整数 代替 , 故 取 !=10。 在 ae=0.01 H}, too (10) = 
一 2. 7638 , 则 拒绝 域 为 : 
W = {t* <-—2. 7638) 
现 由 样本 求 得 t* == 一 2.789, 由 于 样本 落 入 拒绝 域 , 故 在 a==0. 01 水 平 上 拒绝 
开 o, 认 为 甲 矿石 含 铁 量 明显 低 于 乙 人 矿石 的 售 铁 量 。 
有 关 两 个 正 态 总 体 均值 的 假设 检验 的 结果 列 于 表 6. 2. 4。 


表 6. 2.4 两 正 态 总 体 均 值 的 假设 检验 
(显著 性 水 平 为 a) 


pS o (uua? 
U 检验 ne 13> pm (u Kua} 
A M= fa ilu] >u-<) 
(t2t1-Ant+m—2)) 
t 检验 tt 人 2 十 和 2 一 2)) 
Clel>t-<(n+m—2)) 
(uua) 
EM (uue? 
0 检验 (ul >u-<) 
、 1 >4-D) 
近似 tt" <e 0D ) 
检验 


(le |>t1-£ (1)) 
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$63 比率 pp 的 检验 


在 实际 问题 中 ,除了 正 态 总 体外 还 会 遇 到 其 它 一 些 总 体 。 本 节 讨 论 二 点 分 
布 总 体 中 参数 p 的 检验 问题 。 


6. 3. 1 关于 比率 p 的 检验 

在 例 6.1. 2 中 所 给 出 的 检验 实际 上 便 是 关于 p 的 一 个 检验 问题 。 这 里 我 
们 作 一 般 叙 述 。 

设 样本 XX Xa 来 自 二 点 分 布 5(1,p)。 关 于 参数 p 的 检验 问题 也 
有 三 种 类 型 . 


(JDHo: ppo, Hi:p>po (6.3.1) 
(C20H0:pb=po» Hi: p< po (6.3. 2) 
(3)Ho: p= pos Hı: pÆ po (6. 3. 3) 
在 例 6.1.2 中 已 指出 可 用 统计 量 

T= 2X; (6. 3. 4) 

作 检 验 , 针 对 上 述 三 个 检验 问题 拒绝 域 应 分 别 取 如 下 形式 ， E 
W= {Tc) (6. 3. 5) 
W=iT<C') (6.3.6) 
W = TSc: w Tc}, Ci CcC (6. 3. 7) 


为 获得 水 平 为 a 的 检验 ,就 需要 定 出 各 自 拒绝 域 中 的 临界 值 c,c' ,clycsz。 
下 面 给 出 几 种 确定 临界 值 的 方法 。 

6.3.1.1 利用 二 项 分 布 来 决定 临界 值 

在 例 6. 1. 2 中 已 指出 对 检验 问题 (6.3.1) 而 言 , 犯 第 一 类 错误 的 概率 
a(b) =P, TZE p HARA, AREK a(po) 志 a, 且 拒绝 域 不 能 再 扩大 。 
由 于 P= po 时 统计 量 代 一 Zr » Po) XX c 是 满足 下 式 的 最 小 整数 : 


ap) =P, (T>0= 2 | q PA — po) <a (6. 3. 8) 


同 理 可 得 其 它 检验 问题 的 拒绝 域 。 结 果 列 于 表 6.3.1, 
6.3.1.2 用 不 分 布 来 决定 临界 值 
在 第 五 章 § 5.6 中 指出 了 二 项 分 布 与 下 分 布 的 关系 ,有 
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k . , y 


右 端 是 自 AEn F ANANE 。 Po 元 处 的 值 , 其 中 必 一 2c， 
2D AREE G. 3.8) 式 成 立 的 最 小 整数 PRE Fo 0 ) 


> | 或 民 - GooD<5 Gd 名 ?| 成 立 的 最 小 整数 。 对 其 它 检验 问 是 
由 此 决定 的 临界 值 也 列 于 表 6. 3. 1 中 。 
6.3.1.3 大 样本 情况 下 由 正 态 分 布 来 近似 确定 临界 值 
在 大 样本 情况 下 , (6. 3.8) 中 的 概率 可 用 正 态 分 布 作 近 似 计 算 , 此 时 
TAO HAN CO DAA, AM 
npo(1— po) 


E | | c—npo 
2 | |< (6. 3. 9) 
meva npo(1— Po) 


则 c 是 满足 
CNPo0 tF wie VY npo(l— po) (6. 3. 10) 


的 最 小 整数 。 通 常 由 于 二 项 分 布 是 离散 的 , 正 态 分 布 是 连续 的 ,为 此 作 一 修正 
( 见 第 二 章 ), 将 (6. 3. 10) 改 为 : 


cnpo t 0. 5+u1-¿N npol(l— Po) (6. 3.11) 
对 其 它 检 验 问题 也 可 用 此 方法 来 求 临界 值 ,结果 也 列 在 表 6. 3. 1 F. 
例 6.3.1 某 厂 产品 的 优质 品 率 一 直 保 持 在 40% ,近期 技 监 部 门 来 厂 抽 
查 , 共 抽查 了 12 件 产品 ,其 中 优质 品 为 5 件 , 在 一 0.05 水 平 上 能 否认 为 其 优 
质 铝 率 仍 保持 在 40%? 
A X 记 检 查 一 个 产品 时 优质 品 的 个 数 , 则 和 ~2(1,2)。 检 验 问题 为 ， 
Ho:p=0. 4, H,:pF0.4 


拒绝 域 为 
(TSc E Tc}, ci 过 cz 


其 中 了 = 2 Xi cl 与 c; 应 满足 ; 当 po=0. 4 时 
使 p(T<c) 志 成 立 的 最 大 整数 ， 


使 p(T 之 cs) 夺 成 立 的 最 小 整数 。 
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表 6. 3.1 比率 p 的 检验 ( 灵 著 性 水 平 a) 
检验 统计 量 了 一 和 XX 


拒绝 域 {Tc} (TSc 或 之 cs} 


C] 为 满足 


“1 


N| iv ni 
2 |" | psd Po) 入 -7 


c 为 满足 c 为 满足 


n 


a > | | pi 2 的 最 大 整数 ,cs 为 满足 
(1— po)” <a a=p Sa | fn mi i 
临 而 的 最 小 整数 的 最 大 整数 >| Japo S7 
的 最 小 整数 
dl ci 为 满足 
i c 为 满足 c 为 满足 Fi-3 A ES 
F | F¡-.¿(1,v2) Fi-«(% +42) 的 最 大 整数 ， 
确 人 A < 其 中 1 =2(c1+1), v=2(n—c1) 
的 最 小 整数 的 最 大 整数 c2 AWA a» 
定 | 布 | HH =e, 其 中 由 一 2(c 十 1)，| PA 
y =2(n—c+1) v=2(n—c) 的 最 小 整数 
方 HH y =2(2n—c2+1),v2=202 
cl 为 满足 
法 E: | < 为 满足 c 为 满足 c¡Enpo— 0. 5—u1-2 Y npol1— po) 
E| e> np HOSE eN | 的 最 大 整数 | 
JE uj-a Vnpoll— po) | ti-a N npol1— po) Co 为 满足 
似 | 的 最 小 整数 的 最 大 整数 


c2¿npo +0. 5 十 -六 npo(l— po) 
的 最 小 整数 

现 用 二 项 分 布 来 求 临界 值 ,这 里 ~5(12,0.4)。 在 n=12,p 二 0.4 时 ,T 
取 不 同 值 的 概率 如 下 : 


k 0 1 2 ... 8 9 20 


p(T=R)| 0.0022 0.0174 0. 0639 e.. 0. 0420 0.012457 0.002491 


现 取 a=0.05, HF p(T<1)=0. 0196<0. 025, p(T <2) =0. 0835>0. 025, 
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故 取 c=1,X HF p(T>8)=0.0573>0. 025, p(T>9)=0.0153<0. 025, 故 
取 cz? 一 9。 从 而 拒绝 域 为 
(TE R T>9) 
现 耳 二 5, 未 落 入 拒绝 域 ,因而 在 a 二 0.05 水 平 上 认为 该 厂 优 质 品 率 无 明显 恋 
化 。 
0H F AMARGA. 


HR c1, 先 设 c1==1, 则 "hm 22 Ly 67, Fo.sr5 (4,2245 


线性 插值 法 来 求 ,由 附 表 6 查 得 Fo.s7s (4,20) =3. 51, Fo. (4,24) =3. 38, 故 
Fo 975(4,22)=3.445<3.67., 


HT ci 二 2, 则 A =6,1=20, 0 =2 22 , 而 Fo 075 (6， 20)= 3. 13> 


2. 22o 
由 此 知 满足 要 求 的 c 一 1。 


同 理 可 求 cj。 设 c=8, 则 A =10,1=16, 222 一 2 4, 由 线性 插值 可 
HI Foo975(10,16)=3.006>2.4, 


EZ c2¿=9, 则 1n=8,14=18, O 3, 375, 由 线性 插值 可 知 Po. 97s 
(8,18)=3.060<3. 375. 

由 此 知 满足 条 件 的 cz 一 9。 

综 上 可 知 拒绝 域 为 

(了 委 1 或 了 之 9)} 

本 用 二 项 分 布 求 得 的 结论 一 致 ,只 是 在 计算 上 要 简便 一 些 。 

例 6.3.2 如 果 在 例 6. 3. 1 中 抽检 50 件 产品 ,那么 该 检验 问题 的 拒绝 域 
是 什么 ? 

解 :这 里 样本 容量 较 大 , 太 可 用 正 态 近 似 方 法 寻求 临界 信 ci 与 cz, 由 ?一 50， 
Ppo=0. 4,a 一 0. 05 时 0.97 =1. 96 可 知 


npo—0. 5 — tto. 975 VY npo(l— po)=12. 71 


npo tO. 5 十 zo.975WN npo(l— Po)=27. 29 
AR cı =12,c2=28, MF A 0. 05 的 检验 的 拒绝 域 为 
(T<12 或 了 之 28) 
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6.3.2 两 个 比率 的 比较 

ALAN ADA atk Xd, p PREE X Xe ,X 从 另 一 二 点 分 
RAY DO , pz) 中 获得 Yi,Y,, … ,Ym， 两 样本 独 了 并 , 需 对 Pı 与 Pz 进行 比 
EE o 

其 检验 问题 也 有 三 种 : 

(DA.:p <p.» Hi:pi>p? 

(2)Ho:pi 之 pz, Hi:pi<Ppz 

(3)Ho:Pi=pz, Hr:pF Pz 

通常 pi» Po 分 别 用 


一 一 Xi， 2 一 二 之 了 
去 估计 ,因而 可 采用 
T=p,— È: 
作为 检验 用 统计 量 ,拒绝 域 分 别 取 


DW =(»— b2=>c) 
CIW=(p,— p¿=cj 
SW=(lp»=prl>c) 
下 面 仅 给 出 在 大 样本 情况 下 c MAME. 
”在 n,m 都 比较 大 时 ,有 / 
1— $: (P1—P2) 


PT) , pall— pz) 


ni m 


(6. 3. 12) 


近似 服从 N(0,1), 由 于 三 种 情况 下 都 是 在 p= p: 时 犯 第 一 类 错误 的 概率 达 
到 最 大 ,此 时 用 


p= 一 一 一 nm ~ l (6. 3. 13) 


作为 (6. 3. 12) 分 母 中 pip: 的 共同 估计 ,将 
Pira 
U= 


(6. 3.14) 
(pa 


作为 检验 用 统计 量 , 有 关 的 拒绝 域 列 于 表 6.3.2 P, 
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表 6.3.2 用 正 态 近 似 作 两 个 比例 的 检验 


(显著 性 水 平 为 a) 

Ho 拒绝 域 
p< po (uue? 
ppe TESA, 
P1— Pz (lul>u-2) 


例 6. 3.3 某 高 校 随 机 抽取 了 102 个 男 学 生 与 135 个 女 学 生 调 查 家 中 有 
无 计算 机 ,调查 结果 23 个 男 学 生 与 25 个 女 学 生 家 中 有 计算 机 。 在 a=0. 05 水 
平 上 ,能 否认 为 男 . 女 学 生 家 中 拥有 计算 机 的 比率 一 致 ? 

解 : 设 一 个 男 学 生 家 中 拥有 计算 机 数 为 基 , 允 一 5(1,p1); 一 个 女 学 生 家 中 
拥有 计算 机 数 为 了 ,了 一 #(1,pz)。 现 要 检验 的 假设 是 : 

Ho:p1= P2, Hi: pı Æp: 

由 于 这 里 n=102,m=135 均 较 大 , 故 用 正 态 近似 作 检 验 。 Æ a=0. 05 时 ， 

拒绝 域 为 (|U | >u0.975=1. 96) o 


102 135 , 
现在 2vz = 23, Hyi 25, MA Di = 22.54%, p: = 18.52%, b = 


23t 25 
102+135 


0. 2254—0. 1852 


u = 一 一 一 一 一 一 一 一 一 
A | L4] X0. 2025X (1—0. 2025) 


由 于 |z|<1. 96, 所 以 在 a=0.05 上 ,认为 男 、 女 学 生 角 许 拥 有 计算 机 的 比率 无 
PEZ. 


= 1. 897 


"$64 沼 松 分 布 参数 入 的 检验 


设 样本 Xi Xose X, 来自 泊 松 分 布 总 体 书生 一 已 (4) ,天 和 一 人 ,关于 0 的 
检验 问题 也 有 三 类 : 

(FAN， Hi: A>M 

(2)Ho:A4d0) Hi: ÀA<KA 

(3)Ho:4=h, Hi: AM 


通常 是 用 样本 均值 叉 一 二 27 无 去 估计 的 ,从 而 也 可 用 X 作为 检验 统计 量 ， 
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RA T= LX 作 检验 统计 量 , 其 拒绝 域 形式 分 别 为 ， 

DW=(T=>c) 

(SIW=(T<0C) 

SW = (TEC 或 Tc) 
为 获得 水 平 为 a 的 检验 的 拒绝 域 , 需 确定 临界 值 c 或 cycz。 下 面 给 出 两 种 确定 
临界 值 的 方法 : 

方法 一 :利用 X 分 布 来 确定 临界 值 。 

以 检验 问题 

Ho: ÀSA, Hi: A> Ao 
来 讲 , 犯 第 一 类 错误 的 概率 
aA RP (Tc), ASA; 

对 给 定 的 4;T 一 PC(aA) ,又 由 $5.5 知 


一 k —nà 
P(T>0)= 2 AAN) 


其 中 &,(2n24) 表 示 上 自由 度 为 v 的 x 分布 的 分 布 函数 在 2n4 处 的 值 ,> 一 2c,P(T 
之 c) 是 4 的 增 函 数 , 在 AA 时 a(W) 会 达到 最 大 值 ,因而 c 是 满足 
ali) <a 
的 最 小 的 整数 ,也 即 要 求 c 是 满足 
2nAo Xa (20) 
的 最 小 整数 ,其 余 检验 问题 可 类 似 求 出 ,结果 列 于 表 6. 4. 1。 
方法 二 :大 样本 场合 利用 正 态 近似 。 


当 n 充分 大 时 ,有 
T —nA 
/nA 
近似 N(0,1), 当 4=N 时 
| y = 7% 
mas 


近似 N(0,1) ,此 时 


一 mA" Moral 
2) =1—D| ~ [<a 
=e k|} ndo = 


AER > lo 为 满足 


nÀo 
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的 最 小 整数 ,其 余 有 关 结 果 也 列 于 表 6. 4. 1 中 。 
表 6. 4- 1 泊 松 分 布 数 4 的 检验 ( 显 着 性 水 平 为 a) 


检验 统计 量 了 = 2 X; 


a=% 
1% do 
E (TSa RTZ) 
cl AM 
2nAo X22c) > | AZt ata 
ds na (de Ami (te 的 最 大 整数 ,cs 为 满足 
办 的 最 小 整数 的 最 天 整数 2nho 二 (2c) 的 最 小 整数 
确 cl 为 满足 
ES 1E C 为 满足 cado — 412 V naAo 
法 | 分 “| notu nio 的 最 大 整数 ,cs 为 满足 
”| 布 | 的 最 小 整数 cn eM nà 
的 最 小 整数 


例 6. 4.1 放射 性 物质 在 某 固定 长 度 的 时 间 内 放射 的 a 粒子 数 X 服从 泊 
松 分 布 。 现 设 每 次 观测 时 间 长 度 为 90 分 钟 , 共 观测 15 次 ,记录 观测 到 的 a 粒 
子 数 如 下 : 
粒子 数 a 0 1 2 3 4 合计 
频数 n 4 7 2 l 1 15 


MA a=0.1 水 平 上 检验 该 油 松 分 布 参数 是否 为 0. 6。 
解 :此 问题 可 归结 为 检验 问题 
Ho:A=0.6, 万 ; :天 0. 6 
HA 分 布 来 确定 临界 值 。 这 里 ”= 一 15 ,一 0. 6,2n 加 二 18, 取 a=0. 10, 由 于 
Xo.%5(8) 一 15. 597<18 ,Xis(10) 王 18. 307>18, 5 2c +2=8, Bl c 一 3。 
Xo. os (28) =16. 928<<18 , X2. os (30) = 18. 493>18, BZ 2c,=30,BH c,=15, 
因而 a=0. 10 水 平 的 拒绝 域 为 
W=(T<3HT>15) 
在 本 例 中 


4 
T= 2a nai=18>15 
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样本 落 入 拒绝 域 ,因而 拒绝 4 一 0. 6 的 假设 。 
各 本 例 用 正 态 近似 求 , 则 在 a=0. 10 时 Unos 1. 645 „nào = 9, MA mi 


Cindy — u-t V nÀ = å. 065, MI EX ci=4; 


c2¿2nA tus nà =13. 935 » WI HZ cz 一 14。 


则 拒绝 域 为 

W=(T<4 XK T>14) 
SAMBA IES EHRATFTRME n PA) ER AE n E 
够 大 时 才能 用 。 


36.5 检验 的 p 值 


一 个 假设 检验 问题 的 结论 是 简单 的 ,在 给 定 的 显著 性 水 平 下 ,不 是 拒绝 原 
假设 瑟 ,, 就 是 保留 原 假 设 互 ,。 然 而 有 可 能 发 生 如 下 情况 :在 显著 性 水 平 a= 
0. 05 下 拒绝 原 假设 五 ,可 是 在 显著 性 水 平 =0. 01 下 保留 原 假设 。 因 为 降低 
显著 性 水 平 a 会 导致 拒绝 域 缩小 ,这 样 原来 落 在 a 0. 05 的 拒绝 域 中 的 检验 
统计 量 的 观测 值 就 有 可 能 落 在 «0.01 的 接受 域 中 ,假如 这 时 一 个 人 主张 选 
显 着 性 水 平 a=0. 05, 而 另 一 个 人 主张 选 a 二 0.01, 那 么 前 一 个 人 的 结论 是 拒 
绝 本 ,, 而 后 一 个 人 的 结论 是 保留 H ,两 个 人 的 结论 就 完全 相反 。 我 们 该 如 何 
对 符 这 一 问题 呢 ? 为 讨论 这 一 问题 , 先 看 一 个 例子 。 

例 6. 5.1 一 支 香 烟 中 的 尼古丁 含量 X 服从 正 态 分 布 N (x,1), 合 格 标 
准 规定 wk 不 能 超过 1. smg。 为 对 一 批 香烟 的 尼古丁 含量 是 否 合格 作 判 断 , 则 
可 建 芯 如 下 假设 : 

Ho: p<1.5, Hi:p>1.5 

这 是 在 方差 已 知情 况 下 对 正 态 分 布 的 均值 作 单 边 检验 ,所 用 的 检验 统计 量 为 

y 31.5 

1/VYn 
拒绝 域 是 
W = {u Zua} 
现 随 机 抽取 一 盒 (20 支 ) 香 烟 , 测 得 平均 每 支 香 烟 的 尼古丁 含量 为 去 = 
1. 97mg , 则 可 求 得 检验 统计 量 的 值 为 u=2.10. 下 表 对 四 个 不 同 的 显著 性 水 
F a 分别 列 出 相应 的 拒绝 域 和 所 下 的 结论 ， 
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X6.5.1 例 6.$.1 下 不 同 xc 的 拒绝 域 与 结论 


显著 性 水 平 a 拒绝 域 x 一 2.10 时 的 绪论 
0. 05 (u=1. 645) 拒绝 Ho 
0. 025 (u>1. 96) 拒绝 Ho 
0. 01 (u=2. 33) 保留 Ho 


0. 005 (u=2. 58) 保留 Ho 
从 上 表 可 看 出 , 当 a 相对 大 一 些 时 ,U 的 临界 值 就 小 ,从 而 2.10 811 T mA 
值 , 故 应 拒绝 Ho; 而 当 wx 减 小 时 ,临界 但 便 增 大 ,2. 10 就 可 能 不 超过 临界 值 ， 
这 时 便 保 留 Ho. 
现在 ,我 们 换 一 个 角度 来 看 这 一 问题 .用 j= 二 j= 二 1.5 时 检验 统计 量 U 的 
分 布 N(0,1) 可 求 得 


Pa, (U>?. 10)=0. 0179 
这 一 概率 便 是 图 6.5. 1(a) 中 标准 正 态 分 布 右边 尾部 阴影 区 域 的 面积 , 当 
选 定 的 显著 性 水 平 汪 0. 0179 时 ,阴影 区 域 扩大 ( 见 图 6. 5. 1(b)), 临 界 值 向 


(a) 
阴影 区 域 = 0.0179 


(c) 


阴影 区 域 =a< 0.0179 
0 2.10 
临界 值 


图 6.5. 1 a 与 尾部 区 域 间 的 关系 
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左 移 ,从 而 2,10 落 入 拒绝 域 ; 若 c<<0.0179, 则 阴影 区 域 缩 小 ( 见 图 6. 5， 
1(c)), 临界 值 向 右 移 , 从 而 2.10 落 在 接受 域 中 。 从 这 里 可 以 看 出 ,0. 0179 是 
这 个 问题 中 拒绝 H, 的 最 小 的 显著 性 水 平 , 比 它 稍 大 一 点 便 会 导致 保留 Ho» 

这 种 “拒绝 H, 的 最 小 的 显著 性 水 平 ? 就 称 为 p 值 。 在 一 个 检验 问题 中 附带 给 
出 刀 值 对 人 们 作 决 策 是 很 有 好 处 的 。 

在 一 般 场合 ,p 值 的 定义 是 : 
定义 6. 5.1 在 一 个 假设 检验 问题 中 ,拒绝 假设 有 ,的 最 小 显著 性 水 平 称 
A pl. | 
在 现代 计算 机 的 统计 软件 中 都 会 在 一 个 检验 问题 中 给 出 相应 的 p 值 , 那 
么 对 任意 指定 的 显著 水 平 ,我 们 便 可 以 根据 p 值 来 下 结论 . 

仍 来 看 一 下 例 6. 5.1。 如 果 指 定 显著 性 水 平 为 a, 则 拒绝 域 为 {uu 之 u1-。)， 
现在 由 样本 求 得 w=2.10,P{U 之 wu} 二 0. 0179= p, WR a= P {U Zua) > 
P URu) =p, W] uua AM u 落 在 拒绝 域 中 , 故 结论 是 a 水平 下 拒绝 Ho, 
EÈ a=0. 05; WE a= P {U Rua} <P(U>u) = 二 p, 则 过 wl_。; 即 未 落 在 拒 
绝 域 中 , 故 在 a 水平 下 应 保留 Ho i a=0. 071 CLE 6.5.2), 


0 u Ho.g9 


P>0a, RE H, 
图 6. 5.2 比较 p 与 a 下 判断 


对 任意 指定 的 显著 性 水 平 a, 在 与 p 值 比较 后 可 以 得 到 如 下 结论 ; 
结论 一 :如 果 >p 值 , 则 在 显著 性 水 平 a 下 拒绝 Hs 
结论 二 :如果 <p 值 , 则 在 显著 性 水 平 a 下 保留 H. 
任 一 检验 问题 的 p 值 可 以 根据 检验 统计 量 的 样本 观察 值 和 检验 统计 量 
在 Ho 下 一 个 特定 的 参数 值 对 应 的 分 布 求 出 。 例 如 在 正 态 总 体 均值 检验 中 , 当 
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> 未知 时 ,可 采用 检验 统计 量 :一 -外 ,这 时 n 是 样本 容量 ,部 .8 分 别 为 样 


本 均值 和 样本 标准 差 ,在 下 述 三 种 检验 问题 中 , 当 y= 二 jo 时 汉服 从 目 由 度 是 
一 1 的 +t 分布 。 邵 困 由 样本 求 得 i 统计 量 的 观察 值 为 io, 那么 三 种 检验 问题 对 
应 的 p 值 可 分 别 求 出 ， 

DE Ho: Sp XI Hi: K> po 的 检验 中 ,p= 二 Pn (tt) 

(2) 在 Ho: y> po X Hiiu <p 的 检验 中 ,p= 二 Pp Eto); 

(DÁ Ho: U= h HH, : UJE ho ARA, p=P, ( ltd. 
E EI E 值 的 计算 公式 。 

例 6. 5.2 在 例 6.1.2 中 ,我 们 的 检验 问题 是 

Ho:0<0.01, Hi:0>0.01 


在 那里 采用 了 检验 统计 量 了 = Xi, 拒绝 域 为 
(T>3) 
现 求 得 的 样本 观察 值 to。=2, 则 从 表 6.1.2 知 p 16% 
p=Pon (T>2)=0. 264 
因此 , 当 显 著 性 水 平 a0. 264 时 拒绝 Ho, M4 a<0. 264 时 保留 Ho. 


566 广义 似 然 比 检验 


前 面 几 节 讨 论 的 有 关 总 体 参 数 的 检验 方法 是 针对 总 体 分 布 的 具体 类 型 给 
出 的 。 这 一 节 将 给 出 分 布 类 型 已 知 时 构造 检验 统计 量 的 一 般 方法 , 称 为 广义 似 
然 比方 法 。 

BD X 的 密度 函数 (或 分 布 列 ) 为 p(x;9) ,其 中 6 是 未 知 参数 ,9E 98， 
现 考虑 如 下 的 检验 问题 ， | 

Ho:0€0,, H,:0€0, (6. 6.1) 
0,6 HA 6 MHAEFFR,B 0,50, 不 相交 ,下 面 为 方便 起 见 , 讨 论 @, 50, 
之 并 为 @ 的 情况 . 

广义 似 然 比 检验 的 基本 想法 如 下 : 

EX XX 是 来 自 X 的 样本 , 记 其 似 然 函数 为 上 (0) ,6 与 8 分 别 是 
0 在 参数 空间 O. 与 8: 上 的 极 大 似 然 估计 , 似 然 函 数 在 O. 与 8@ 上 的 极 大 值 分 
HUA LO) LO), BN LO) =maxL (0) ,了 (0) =maxL (0) , 记 其 比值 为 
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L(0,) 

LÔ) 

4 是 一 个 统计 量 , 由 于 范围 越 大 , 工 的 最 大 值 总 不 会 减 小 , 故 总 有 二 (加 ) 委 
7 0) ,这 意味 着 0 和 4 委 ]1。 由 于 似 然 函 数 可 以 看 成 是 给 出 样本 后 ,2 出 现 可 能 性 
的 一 种 度量 。 因 而 当 五 ,为 真 时 ,二 (0) 应 取 较 大 的 值 ; 当 H, RAT, LOOR 
取 值 较 小 。 所 以 将 (6. 6. 2) 作 为 检验 问题 (6. 6. 11) 的 检验 统计 量 时 ,拒绝 域 应 
取 ， 


(6. 6. 2) 


A=ACX, DE yr” Xn) — 


W= {<&c} | (6. 6. 3) 
其 中 c 应 满足 如 下 条 件 , 使 

Paic Sa 060, (6. 6. 4) 
且 尽 可 能 接近 a。 今后 我 们 称 统 计量 (6. 6. 2) 为 似 然 比 统计 量 , 由 此 获得 的 检 
验 称 为 水 平 是 a 的 广义 似 然 比 检验 , 


有 时 根据 (6. 6.4) 不 易 求 出 c, 但 如 果 存 在 另 一 个 统计 量 GGA, X: 
t Xn), H A ME G 严格 上 升 (或 严格 下 降 ) ,而 G 的 分 位 数 容易 得 到 的 话 , 那 么 
根据 G 可 定 出 拒绝 域 

W=(G<c' HER W=(G>c')) (6. 6. 5) 
其 中 c' 满 足 如 下 条 件 , 使 
PAGE) <a (Ek Pel GEce), OEO, 

且 尽 可 能 接近 于 a, 则 基于 G 的 拒绝 域 (6. 6.5) 与 (6. 6. 3) 等 价 ,这 样 构造 的 检 
验 也 是 广义 似 然 比 检 验 , 只 是 所 用 的 统计 量 不 同 , 前 者 用 4, 后 者 用 G。 

例 6.6.1 REÉAX-N(10), EX EMMA O=((u,0?) , —o< p<oo, 
rc >0}, 从 中 获得 样本 XX 29009 Xn 下面 考虑 检验 问题 

到 op 一 /po Hi: pE 

的 广义 似 然 比 检验 ， 

解 :在 这 一 检验 问题 中 

他 一 人 CUI) :p= pn, 0> 0} 

似 然 函数 为 


A 


1 1 | 
L(x >= I] Ta P > s Cai — 0%) (6. 6. 6) 


在 @ 上 A 与 的 MLE 分 别 为 =X o =S}, 在 @B, 上 s H= pg y 0” 的 MLE 为 


=+ 2 (X:— po) ,将 它们 代入 似 然 函 数 (6. 6. 6) ,得 
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a 1 
L009) =| 


n 


aan - 
LCH, oo0) | Ino, e 2 


则 似 然 比 统 计量 
Loa) 0o 本 >, (Ki— M0 Y? e 
Lo) Vol |XX) 
-| LEN 
STOCK 一 又) 
t? —n/2 
= [145] 
ym 2 Si Tm" 4 是 上 的 严 减 函数 ， 放 拒 绝 域 W 二 {4<c} 等 价 于 W= ("> 


ci ,也 等 价 于 W=(leil> 0"), 
由 于 在 y= 二 jw 时 ,~ 一 1), 故 cc 满足 
P,Cltl>c")=a 
BN 0"=t-2(a— DD). AS 3 6.2 中 所 得 到 的 检验 相同 , 即 水 平 为 a 的 检验 的 拒 
绝 域 是 
W=(l2|>t1-<(n—1)) 


这 一 例子 也 从 一 个 侧面 说 明了 广义 似 然 比 检验 的 合理 性 . 


$67 Xx’? 拟 合 优 度 检验 


前 几 节 所 讨论 的 检验 问题 是 在 分 布 形式 已 知 的 前 提 下 对 分 布 的 参数 进行 
的 ,它们 都 属于 参数 假设 检验 问题 。 当 我 们 对 总 体 分 布 知之 其 少时 ,就 要 采用 
非 参 数 检验 ,从 本 节 开 始 介绍 几 种 常用 的 非 参 数 检验 方法 。 我 们 首先 讨论 x 人 
拟 合 优 度 检验 。 

假定 一 个 总 体 可 分 为 r 类 , 现 从 该 总 体 获得 了 一 个 样本 一 一 这 这 是 一 批 分 
类 数据 ,现在 需要 我 们 从 这 些 分 类 数据 出 发 ,去 判断 总 体 各 类 出 现 的 概率 是 否 
与 已 知 的 概率 相符 。 璧 如 要 检验 一 颗 众 子 是 否 是 均匀 的 ,那么 我 们 可 以 将 该 般 
子 抛 搏 奉 干 次 ,记录 每 一 面 出 现 的 次 数 , 从 这 批 数据 出 发 去 检验 各 面 出 现 的 概 
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MAI reli A — n'i Kamm a. A A . 


率 是 否 都 是 1/6,X 拟 合 优 度 检验 就 是 用 来 检验 一 批 分 类 数据 所 来 目的 总 体 
的 分 布 是 否 与 某 种 理论 分 布 相 一 致 , 在 实际 问题 中 常会 遇 到 这 种 分 类 数据 ,本 
节 就 讨论 这 类 数据 的 有 关 检 验 问题 。 


6.7.1 总 体 可 分 为 有 限 类 , 且 总 体 分 布 不 含 未 知 参数 
BBE X HA r R, WN 4 , 4，…4， | 
Ho:plA:) =P >» 1=1,2»"" 


其 中 各 p: EA, p:>0, H SPLNE na n 次 观察 ,各 类 出 现 的 频数 


DAA monon El Za mi. E Ho AIR p: 与 频率 n/n 应 相关 


不 大 ,或 各 观察 频数 n 与 理论 频数 np; 应 相差 不 大 。 据 此 想法 ,英国 统计 学 家 
K. Pearson 提出 了 一 个 检验 统计 量 


- ,一 .2 
太一 之。 me np) (6.7.1) 


并 指出 , 当 样 本 容量 n 充分 大 且 H, >, Xx 近似 服从 自由 度 为 7 一 1 的 六 
分 布 。 

从 统计 量 (6.7.1) 的 结构 看 , 当 互 。 为 真 时 ,和 式 中 每 一 项 的 分 子 (m 一 
nP) 都 不 应 太 大 ,从 而 总 和 也 不 会 太 大 , 若 好 过 大 ,人 们 就 会 认为 原 假 设 Ho 
不 真 。 基 于 此 想法 ,检验 的 拒绝 域 应 有 如 下 形式 ， | 

W=iX=c) 
对 于 给 定 的 显著 性 水 平 a, 由 分 布 LoDE c= Gr DD 

例 6.7.1 某 大 公司 的 人 事 部 门 希 望 了 解 公 司职 工 的 病假 是 否 均匀 分 布 
在 周一 到 周 五 ,以 便 合理 安排 工作 。 如 今 抽 取 了 100 名 病假 职工 ,其 病假 日 分 
布 如 下 : / 

工作 日 周一 周二 周三 周 四 周 五 

频数 17 27 10 28 18 

试问 该 公司 职工 病假 是 否 均匀 分 布 在 一 周 五 个 工作 日 中 (ce 一 0.05)? 


解 : 震 病 假 是 均匀 分 布 在 五 个 工作 日 内 , 则 应 YA 如 一 二 于 一 1， 2,… ,5, 以 
A 表示 “病假 在 周 i”, 则 要 检验 假设 | 
HPA) == , ¿=1,2,* ,5 
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采用 统计 量 (6. 7. 1) ,由 于 >r=5, 在 e=0.05 时 ,xi ss(4) 一 9. 49, 因 而 拒绝 域 为 
W=(x=9. 49) 
为 计算 统计 量 x 的 值 ,可 列 成 如 下 计算 表格 : 


表 6.7.1 允 值 计算 表 


工作 日 ni i np: (ns —np:)*/ apo) 
周一 17 20 0. 45 
周二 27 20 2.45 

三 10 20 5. 00 
周 四 28 20 3. 20 
HH 18 20 0. 20 
Fi 100 11. 30 
由 上 表 知 

p= > Up" map? 11. 3059. 49 


这 表明 样本 落 在 拒绝 域 中 ， 因而 在 a=0. 05 水 平 上 拒绝 原 假设 Ho UIRA 
司职 工 病假 在 五 个 工作 日 中 不 是 均匀 分 布 的 。 


6. 7.2 总 体 可 分 为 有 限 类 ,但 总 体 分 布 含 有 未 知 参 数 
先 看 一 个 例子 。 


例 6.7.2 在 某 交 叉 路 口 记录 每 15 秒 钟 内 通过 的 汽车 数量 , 共 观 察 了 25 
分 钟 ,得 100 个 记录 ,经 整理 得 : 
通过 的 汽车 数量 | 0 1 2 3 4 5 6 7 8 9 10 1i 
频数 1 5 15 17 26 11 9 8 3 2 2 1 


在 a=0. 05 水 平 上 检验 如 下 假设 :通过 该 交叉 路 口 的 汽车 数量 服从 泊 松 分 布 
POD. 

在 本 例 中 ,要 检验 总 体 是 否 服从 泊 松 分 布 ,大 家 知道 服从 泊 松 分 布 的 随机 
变量 可 取 所 有 的 非 负 整数 ,然而 尽管 它 可 取 可 数 个 值 ,但 取 大 量 值 的 概率 是 非 
常 之 小 ,因而 可 以 忽略 不 计 , 另 一 方面 ,在 对 该 随机 变量 进行 实际 观察 时 也 只 
能 观察 到 有 限 个 不 同 值 ,譬如 在 本 例 中 ,只 观察 到 0,1,…,11 等 12 个 值 .这 相 
当 于 把 总 体 分 成 12 类 ,每 一 类 出 现 的 概率 分 别 为 ， 
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pi= e?) 1 一 0,1，…，10 
pn = 2 Lom (6.7.2) 
从 而 把 所 要 检验 的 原 假 设 记 为 ， | 
Ho:P(AD =p:  ¿=0,1,""",11 

其 中 A; 表示 15 秒 钟 内 通过 交叉 路 口 的 汽车 为 i 辆 ,i 一 0,1,…,10,Al1 表 示 15 
秒 钟 内 通过 交叉 路 口 的 汽车 超过 10 辆 ,各 p: 如 (6.7.2) 所 示 。 

这 里 还 遇 到 另 一 个 麻烦 , 即 总 体 分 布 中 含有 未 知 参数 4, 当然 这 个 4 可 以 
用 样本 均值 区 =4. 28 去 估计 。 当 时 K. Pearson 仍 采 用 统计 量 (6. 7. 1) ,并 认为 
其 在 Ho 为 真 时 服从 Xo), AA 1924 年 英国 统计 学 家 R. A. Fisher 纠正 
了 这 一 错误 ,他 证 明了 在 总 体 分 布 中 含有 有 个 独立 的 未 知 参数 时 , 若 这 个 参 
数 用 极 大 似 然 估计 代替, 则 (6. 7.1) 中 的 p: 用 $i 代替 , 当 样 本 容量 充分 大 时 


Fr 9 
g=), HIP a, 一 (6.7. 3) 


近似 服从 自由 度 为 r 一 k 一 1 的 x 分布 。 

基于 这 一 关键 的 修正 ,我 们 来 完成 例 6.7. 2 的 检验 问题 ，。 

首先 在 (6.7.2) 中 含有 一 个 未 知 参数 ,用 其 极 大 似 然 估 计 坪 一 4.28 代 
替 , 从 而 有 


o A. DRie 一 4 28 ` 
D: = z 】 


9 2=0,1-"",10 


一 4.2 zt — 4.28 
w=) d. 28e *" 


=11 2! 


其 次 ,由 于 我 们 要 采用 检验 统计 量 (6. 7. 3) 的 近似 分 布 来 确定 拒绝 域 , 因 
而 要 求 各 ni 不 能 过 少 ,通常 要 求 n, 宇 5, 当 某 些 频数 小 于 5 时 ,通常 的 做 法 是 
将 邻近 知 干 组 合并 。 在 本 例 中 ,no 二 1 二 5, 因 而 可 将 i=0 与 i=1 的 两 组 合并 ， 
同样 ,由 于 i 实 8 时 各 组 频数 亦 小 于 5, 因 而 也 将 它们 合并 ,从 而 这 里 组 数 r= 
8 ,未知 参数 个 数 =1, 采 用 统计 量 (6.7.3), 在 ==0.05 时 ,X68 一 1 一 1)= 
Xë s (6)=12. 592 ,拒绝 域 为 

W= {X 之 12. 592) 
AUTE 值 的 计算 见 表 6.7.2。 由 于 X:=5.7897 过 12. 592, 故 在 a 二 0. 05 KE 
上 ,可 保留 Ho BA 15 秒 钟 内 通过 交叉 路 口 的 汽车 数量 服从 参数 A 二 4. 28 
的 让 松 分 布 。 
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i n Di nh; 
<1 6 0. 0730 7. 30 
2 15 0. 1268 12. 68 
3 17 0. 1809 18. 09 
4 26 0. 1935 19. 35 
5 11 0. 1657 16. 57 
6 9 0. 1182 11. 82 
7 3 0. 0723 7.23 
=8 8 0. 0696 6. 96 
合计 100 


6.7.3 总 体 为 连续 分 布 的 情况 


(ma —npiY 


nb; 

0. 2315 
O. 4245 
0. 0657 
2. 2854 
1. 8724 
O. 6728 
0. 0820 
0. 1554 
5. 7897 


设 样本 X1 DETE sA n 为 来 目 总 体 X 的 一 个 样本 ,要 检验 的 假设 是 : 


Ho: X 服从 分 布 F(x) 


其 中 下 (z) 中 可 以 含有 个 未 知 参数 ,车 二 0, 那 F(z) 就 完全 已 知 。 


在 这 种 情况 下 检验 五 ,的 做 法 如 下 : 


(1) 把 的 取 值 范围 分 成 r 个 区 间 , 为 确定 起 见 , 不 妨 设 为 ， 
一 co 一 QOS LI<Qr< H <a Aa, = OO 
设 各 区 间 为 A, =(a,,a1],42=(a1,a2],*", A, -¡=(a,-2,0,-1], 4 一 (ayar); 
(2) 统 计 样 本 落 入 这 7 个 区 间 的 频数 ,分 别 记 为 m1 ,ns,… ,n,;。 这 里 要 求 各 


m3; 


GH REO 时 ,对 上 个 未 知 参 数 给 出 其 极 大 似 然 估 计 , 记 
pÍ=Pl£a;.<X<Xa)=FCa)—F(a;-,) 


从 而 用 未 知 参 数 的 极 大 似 然 估计 代替 后 可 算得 各 bio 


这 样 就 把 检验 问题 转化 为 分 类 数据 的 检验 问题 ,以 后 的 计算 同 6.7. 1 或 


6. 7. 2 小 节 , 视 未 知 参数 个 数 有 一 0 或 上 天 0 而 定 。 


例 6.7.3 为 研究 混凝土 抗 压强 度 的 分 布 ,抽取 了 200 件 混凝土 制 件 测 


定 其 抗 压强 度 ,经 整理 得 频数 分 布 表 如 下 见 表 。 


WTE a 一 0. 05 水 平 上 检验 抗 压 强度 的 分 布 是 否 为 正 态 分 布 。 


解 :者 用 F(z) 表示 Ne) 的 分 布 函数 , 则 本 例 便 要 检验 假设 : 


Ho: 抗 压强 度 的 分 布 为 F(x) 
320 


A e NP pg i 


抗 压强 度 区 间 频数 


CAMA 
(190,200 ] 10 
(200,210 ] 26 
(210,220 | 96 
(220,230] 64 
(230,240] | 30 
(240,250] 14 
合计 200 


又 由 于 F(z) 中 含有 两 个 未 知 参 数 py 与 吗 ,因而 需 用 它们 的 极 大 似 然 估计 
去 蔡 代 .这 里 仅 给 出 了 样本 的 分 组 数据 ,因此 只 能 用 组 中 值 ( 即 区 间 中 点 ) 去 代 
符 原 始 数据 ,然后 求 pk 与 只 的 MZE。 现 在 6 个 组 中 值 分 别 为 zı =195, 4) = 
205,23=215,121=225,15=235,1=245, 于 是 


1 一 
/一 二 一 700 MT =221 
| 6 
AÈ 一 2 2 — o 
ó == zog 24m ¿(ai —x)*=152, 6=s,.=12. 33 


在 N(221,152) 分 布下 , 求 出 落 在 区 间 (a;_;,a;j 内 的 概率 的 估计 和 值 ， 
221 a;_1— 221 
p= -a lA | -/152 |; 
不 过 向 将 ao EN —0, Ha, 定 为 十 ce 。 本 例 中 7>=6.。 采 用 (6.7. 3) 作 为 检验 统 
计量 ,在 a=0. 05 Hf, X3 s (6—2—1)= X}. (3)=7. 815, H MHEARA 


E 6.7.3 多 值 计 算 表 


z=] 了 


区 间 be 2 
© (~=%,200] 0.111 
(200,210] 0. 203 
(210,220] 0. 001 
(220,230] 0. 295 
(230,240] 0. 516 
(240,00) 0. 206 
合计 1. 332 
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W=1(xXé=>7. 815) 

由 样本 计算 x 值 的 过 程 列 于 表 6. 7. 3 中 。 由 此 可 知 2=1. 332<7. 815, 
这 表明 样本 落 入 接受 域 ,可 接受 抗 压强 度 服从 正 态 分 布 的 假定 。 

由 本 例 可 见 , 当 F(z) 为 连续 分 布 时 需 将 取 值 区 间 进 行 分 组 ,从 而 检验 结 
论 依赖 于 分 组 ,分 组 不 同 有 可 能 得 出 不 同 的 结论 ,这 便 是 在 连续 分 布 场合 x 
拟 合 优 度 检验 的 不 足 之 处 。 对 正 态 分 布 的 检验 将 在 3 6.8 中 专门 介绍 一 些 检 
验方 法 ,然而 在 其 它 分 布 场 台 尚 缺少 专门 的 检验 方法 , 故 不 得 不 用 此 xX? 拟 合 
RERE. 


6.7.4 列 联 表 的 独立 性 检验 

在 有 些 实 际 问题 中 , 当 我 们 抽取 了 一 个 容量 为 n 的 样本 后 ,对 样本 中 每 一 
样品 可 按 不 同 特性 进行 分 类 .例如 在 进行 失业 人 员 情 况 调查 时 ,对 抽取 的 每 一 
位 失业 人 员 可 按 其 性 别 分 类 ,也 可 按 其 年 龄 分 类 ,当然 还 可 按 其 它 特征 分 类 ， 
又 如 在 工厂 中 调查 某 类 产品 的 质量 时 ,可 按 该 产品 的 生产 小 组 分 类 ,也 可 按 其 
是 否 合 格 分 类 等 等 。 当 我 们 用 两 特性 对 样品 分 类 时 , 记 这 两 个 特性 分 别 为 XA, 与 
Xs, 不 妨 设 XX! 有 > 个 类 别 ,X 有 c 个 类 别 , 则 可 把 被 调查 的 ”个 样品 按 其 所 属 
类 别 进行 分 类 , 列 成 如 下 一 张 >Xec 的 二 维 表 ,这 张 表 也 称 为 (二 维 ) 列 联 表 


Xy 


其 中 表示 特性 XX! 属 A 类 、 特 性 X: 属 B; 类 的 样品 数 , 即 频数 ,通常 在 二 维 
表 中 还 按 行 、 按 列 分 别 求 出 其 合计 数 : 


C 

ni. = D nis i=1,2,**.7 
j=l 
r 

n. j; ani» z 一 | 上 |， 2s" ,C 


Yn. =Yn. =n 
在 这 种 列 联 表 中 ， 人 们 关心 .的 问题 是 两 个 特性 是 否 独 立 , 称 这 类 问题 为 列 


联 表 的 独立 性 检验 。 为 明确 写 出 检验 问题 , 记 总 体 为 X, 它 是 二 维 变量 (Xi， 
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X) XE Xy 被 分 成 rr 类 Aj) Azs "+A, X2 被 分 成 < 类 Bis Bos Bo. IZ 
P(XEAMNB;)=PC XIE A  X.EB, )=p; 
其 中 ;一 1,2,……,r;y7 一 1,2，…c。 XE 


pi- =P (XE A) = 24 ps I= ],2,* 7 
j= 
p =P XR:E B) = 21 pi» 1 一 1，2，… sc 


LEYA D p= pl 那么 当 X, 与 Xs 两 个 特性 独立 时 ,应 对 一 切 i， 
JA 
六 5 一 六 六. 
因此 我 们 的 检验 问题 为 
Ho: pis= pi.p.; Yi,j (6.7. 4) 
H EDR G, j) bibi po 
它 也 可 采用 (6. 7. 1) 那 种 统计 量 ,在 这 一 问题 中 统计 量 X 可 改写 为 : 


Y == 2 2 (ni —npi) /npi) 


一 2 2 (nij—npi. p Jl ps. pb.) 
最 后 一 个 等 式 是 在 (6. 7.4) 中 原 假 设 Ho 为 真 时 导出 的 ,在 最 后 一 个 式 子 中 有 
rr 二 ec 个 未 知 参 数 Pi. 和 p. CG =1,2, 77 一 1,2,…c) 需 要 估计 ,又 由 


Fp. =l, 4 思 .j 一 1, 因 而 只 有 +r 十 c 一 2 个 独立 参数 需要 估计 。 各 pi M 
.的 极 大 似 然 估计 分 别 为 ， 


n.j ， 
Do => j=1,2,""",c 


因而 对 检验 问题 (6.7. 4) ,可 采用 检验 统计 量 
x= 2 2, Cuab ha (6. 7. 5) 
E Ho 为 真 ,n 较 大 时 ,入 近似 服从 目 由 度 是 — lre 2D) —1= (71) (c—1) 
的 好 分布 。 对 给 定 的 显著 性 水 平 a, 拒 绝 域 为 
到 一 (和 之 好 CC 一 1)Cc 一 1))) (6.7. 6) 
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例 6. 7.4 某 地 调查 了 3000 名 失业 人 员 , 按 性 别 文化 程度 分 类 如 下 ， 


文化 程度 以上 中 专 技校 ”高 中 初中 及 以 下 | 合 +H 
EJI 


Es 40 138 620 1 043 } 841 
女 20 72 442 625 1 159 
合 şt 60 210 1 062 1 668 3 000 


试 在 a=0. 05 水 平 上 检验 失业 人 员 的 性 别 与 文化 程度 是 否 有 关 。 
解 : 这 是 列 联 表 的 独立 性 检验 问题 。 在 本 例 中 r=2,c=4, Æ a=0.05 F, 
Xb. os ((r— 1) (c—1)) = Xos (3) =7. 815, 因 而 拒绝 域 为 ， 
W= {X 7. 815} 


为 了 计算 统计 量 (6.7. 5) ,可 列 成 如 下 表格 计算 nb. p.j ER, 


pop | 大 专 以 上 ”中 专 技校 。 ”高 中 初中 及 以 下 | 合 计 


P 36.8 128. 9 651.7 1 023.6 1841 
E 23. 2 81.1 410.3 644.4 1159 
合计 60 210 1 062 1 668 3 000 
从 而 得 
2 (40—36. 8) | (20—23.2)° 
X= 36.8 1 232 十 
(1043—1023.6): (625—644.4)? 
+ 1023. 6 + 644. 4 =. 236 


由 于 多 二 7. 326<7. 815 ,样本 落 入 接受 域 , 从 而 在 a=0. 05 水 平 上 可 认为 失业 
人 员 的 性 别 与 文化 程度 无 关 ， 
例 6.7.5 目前 有 的 零售 商店 开展 上 门 服务 的 业务 ,有 的 不 开展 此 项 业 


务 。 为 了 解 这 项 业务 的 开展 与 否 与 其 月 销售 额 是 否 有 关 , 调 查 了 363 个 商店 ， 
结 采 如 下 : | 


A 
上 门 服务 32 111 104 40 14 301 
不 上 门 服务 | 29 24 6 2 1 62 


si Ta O 
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试 在 a 二 0. 01 水 平 上 检验 服务 方式 与 月 销售 额 是 否 有 大。 
解 :这 也 是 列 联 表 的 独立 性 检验 问题 ,在 本 例 中 r=2,c= 二 5, 在 a 二 0.01 
时 ,Xi 09 (4) =13. 277, MEL RRA 
W = {X 13. 277) 


为 计算 统计 量 (6. 7.5), 先 在 独立 性 假设 下 求 出 各 npi. p.¡= -如 下 
上 门 服务 | 50.6 ER 


不 上 门 服务 | 10. 
由 此 可 得 好 =56. 38>13. 277 ,样本 落 在 拒绝 域 中 ,这 说 明 是 否 开展 上 门 服务 


111.9 34.8 
4 23. 1 18. 8 
这 项 业务 与 月 销售 额 有 关 。 np.» ., 的 比较 中 可 见 , 在 月 销售 额 超 过 


5000 元 的 情况 下 ,开展 上 门 服务 的 实际 频数 n;; 高 于 理论 频数 np;.$.;, 这 便 说 
明 上 门 服务 有 利于 提高 月 销售 额 .。 


h| 


$6.8 正 态 性 检验 


用 于 判断 总 体 分 布 是 否 为 正 态 分 布 的 检验 称 为 正 态 性 检验 。 由 于 正 态 分 
布 在 实际 中 频繁 使 用 ,迫使 统计 学 家 去 寻找 专门 的 正 态 性 检验 ,至 今 已 有 几 十 
种 正 态 检验 方法 ,国际 标准 化 组 织 统计 标准 分 委员 会 组 织 统计 学 家 对 这 些 正 
态 性 检验 方法 进行 比较 ,最 后 认为 Wilk 一 Shapiro H W 检验 和 Dagustino 的 
D 检验 是 最 好 的 ,它们 犯 第 二 类 错误 的 概率 最 小 , 故 该 委员 会 向 世界 各 国 推 荐 
这 两 个 正 态 性 检验 .我 国 统计 方法 标准 化 委员 会 经 过 研究 和 比较 ,接受 此 项 建 
议 , 把 这 两 个 正 态 性 检验 列 为 国家 标准 ,编号 为 GB488 一 85。 下 面 我 们 介绍 这 
两 个 检验 的 操作 方法 ,原理 请 参阅 蔓 诗 松 、 王 静 龙 编 的 《数理 统计 》8 5. 5。 


6.8.1 小 样本 (3 二 nn 志 50) 场 合 的 玉 检验 
设 从 总 体 X 中 抽取 了 容量 为 n 的 样本 > EEP. CUE. CP 现 要 检验 如 下 假 
设 
Ho:X 服从 正 态 分 布 


在 3<n<50 时 ,Wilk 与 Shapiro 提出 用 如 下 的 W 统计 量 ， 


| 2 (aa) Xo% | 
W= (6.8.1) 
Y ay AX -X 
它 可 以 看 成 是 数 对 (a zo)i=1, 2 ,en 的 相关 系数 的 平方 , 故 统计 量 W 在 
[0,1j 取 值 。 
(6. 8. 1) 式 中 的 系数 Cl dd29""" 304, 具有 如 下 性 质 


. 7 
人 一 人 十 1 一 ;9 :=1,2,…, [2 | 


2/4:=0, 21a?=1 
MA AA, RX alyaz，…，an 已 制 成 表格 供 查 用 ( 附 表 8)。 利 用 系数 as 的 性 
质 , 统 计量 (6. 8.1) 可 简化 为 


[1/2] 


en (X nti- Xo 


NA —X y 


可 以 证 明 ,在 Ho 为 真 时 ,W 的 取 值 应 接近 于 1 ,因而 检验 的 拒绝 域 取 下 
述 形式 是 合理 的 ， | 


(6. 8. 2) 


(WX<c) 
对 给 定 的 显著 性 水 平 ,在 正 态 分 布 假定 下 ,使 PWS) =a 的 临界 值 c 可 从 
附 表 9 查 得 , 记 “一 W。, 从 而 拒绝 域 为 | 
(WW.); | (6. 8. 3) 
516.81 HERIDA IET WOBNEZ 10 人 ,得 到 他 们 治疗 前 后 的 血 
TEOREMA EEE: 
2.7 —1.2 —1.0 0 0.7 2.0 3.7 —0.6 0.8 一 0.3 
现 要 检验 治疗 前 后 血红 蛋白 的 差 是 否 服从 正 态 分 布 ( 取 a=0. 05). 
解 : 这 里 ”一 10, 在 a=0.05 时 , 查 附 表 9 知 ,Wuvos=0.842, 故 用 统计 量 
(6. 8. 2) 作 正 态 性 检验 的 拒绝 域 为 | 
(WO. 842) 
为 计算 统计 量 (6. 8.2), 常 列 成 如 表 6.8.1 的 计算 表 , 其 中 第 二 列 zw 为 
小 的 一 半 观 测 值 按 升序 排列 的 ,第 三 列 do ARS 一 半 观 测 值 按 降序 排列 
的 ,第 五 列 a; 由 附 表 8 查 得 。 
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表 6.8.1 W 统计 量 的 计算 表 


1 Xii) Tnt1—i) Lint- TEO A; 

1 —1.2 3.7 4. 9 0. 9739 
2 —1.0 2. T 3. 7 0. 3291 
3 —0. 6 2. 0 | 2» 6 0. 2141 
4 —0.3 0. 8 1-1 0. 1224 
9 0 0. 7 0. 7 0. 0399 


5 
之 。 ai(Tati) — Ta) =4.74901 
10 | 
2 (x:—z)=24. 376 
从 而 


_ 4. 74901? 
24. 376 


由 于 样本 落 入 接受 域 , 故 在 a=0. 05 水 平 上 不 拒绝 正 态 性 假设 。 


W =0. 9252>0. 842 


6.8.2 KÆEFIDS (1>SDM DER 
在 样本 容量 nn >50 时 , 附 表 8 与 附 表 9 中 的 值 难以 计算 ,因而 Dagustino 
建议 用 以 下 统计 量 


AN AX) 
i=] 


在 Ho AAt, E(D)==0. 28209479, Var (D) =0. 02998598/4 n , H 
~ (D—0. 28209479) / a (6. 8. 5) 
的 渐 近 分 布 为 N(0,1), 但 由 于 其 接近 N(0,1) 的 速度 十 分 慢 , 因 而 Dagustino 
用 随机 模拟 法 得 到 了 YY 的 分 位 数 表 ( 附 表 10) 。 在 给 定 了 显著 性 水 平 a 后 ,用 
wit E Y 作 检 验 的 拒绝 域 为 
(YY Y >Y 1-2) (6. 8. 6) 
例 6. 8.2 上 海中 心气 象 台 测定 的 上 海 市 1884 一 1982 年 间 的 年 降雨 量 
数据 如 下 (单位 :mm): 
1] 184.4 1 113-4 1203.9 1 170.7 975.4 1 462.3 947.8 1416.0 709. 2 
1 147.5 935.0 1 016.3 1031.6 1 105.7 849.9 12334 1008.6 1 063.8 
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D (6.8. 4) 


Y 


1004.9 1086.2 1022.5 1330.9 1439.4 1236.5 1088.1 1288.7 1115.8 
1217.5 1320.7 1078.1 1203.4 1480.0 1269.9 1049.2 1318.4 1192.0 
1 016.0 1508.2 1159.6 1021.3 986.1 794.7 1318.3 1171.2 1161.7 

791.2 1143.8 1602.0 951.4 1003.2 840.4 1061.4 958.0 1 025.2 
1 265.0 1196.5 1120.7 1659.3 942.7 1123.3 910.2 1398.5 1 208.6 
1 305.5 1 242.3 1572.3 1416.9 1256.1 1285.9 984.8 1390.3 1 062.2 
1 287.3 1477.0 1017.9 1217.7 1197.1 1143.0 1018.8 1243.7 909.3 
1 030.3 1124.4 811.4 820.9 1184.1 1107.5 991.4 901.7 1176.9 
1 113.5 1272.9 1200.3 1508.7 772.3 813.0 1392.3 1006.2 1108.8 

试 在 "一 0. 05 水 平 上 检验 年 降雨 量 是 否 服从 正 态 分 布 。 


解 :由 于 n=99, 故 用 统计 量 D 作 检 验 ,在 a 二 0.05 时 ,由 附 表 10 查 得 
Y o. 025 二 一 2. 543,Y0.975=1. 307, 故 拒绝 域 为 
(Y <-—2. 543 或 了 之 1. 307) 
现 经 计算 有 
D=0. 2816,  Y=—0. 15242226 
H TEERAA, AE a=0. 05 时 可 认为 年 降雨 量 服从 正 态 分 布 。 
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ES 


第 七 És 


方差 分 析 和 回归 分 析 


$71 单 因 子 方差 分 析 


7.1.1 问题 的 提出 

在 实际 工作 中 常会 遇 到 比较 多 个 总 体 均 值 是 否 相 等 的 问题 ,例如 某 工 厂 
的 原料 来 自 四 个 不 同 地 区 ,那么 用 不 同 地 区 的 原料 生产 的 产品 的 质量 是 否 一 
致 ?又 如 某 工厂 有 三 个 联营 厂 ,生产 同 一 产品 ;生产 工艺 也 相同 ,那么 这 几 个 联 
营 厂 的 产品 质量 有 无 明显 差异 ?再 如 某 厂 有 五 个 检验 员 , 他 们 检验 同一 产品 的 
检验 技术 水 平 是 否 一 致 ? 类 似 问 题 有 许多 .它们 都 是 同时 比较 多 个 均值 是 否 相 
等 的 问题 .今后 我 们 称 所 要 比较 的 地 区 .联营 厂 ,检验 员 等 为 因子 ,因子 所 处 的 
状态 称 为 水 平 ,如 四 个 地 区 便 是 地 区 这 一 因子 的 四 个 水 平 , 三 个 联营 厂 便 是 联 
营 厂 这 一 因子 的 三 个 水 平 ,五 个 检验 员 便 是 检验 员 这 一 因子 的 五 个 水 平 。 

为 方便 起 见 , 今 后 用 大 写字 母 4、.B、C 等 表示 因子 ,用 大 写字 母 加 下 标 表 
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示 该 因子 的 水 平 ,如 4 的 水 平 用 4 ,4:,… 等 表示 。 

下 面 用 一 个 例子 来 说 明 问 题 的 提 法 。 

例 7.1.1 某 食品 公司 对 一 种 食品 设计 了 四 种 新 包 狂 .为 了 考察 哪 种 包 
装 最 受 欢迎 , 选 了 十 个 有 近似 相同 销售 量 的 商店 作 试验 ,其 中 两 种 包 污 各 指定 
两 个 商店 销售 , 另 两 种 包装 各 指定 三 个 商店 销售 ,在 试验 期 中 各 商店 的 贷 染 排 
放 位 置 、 空 间 都 尽量 一 致 ,营业 员 的 促销 方法 也 基本 相同 。 观 察 在 一 定时 期 的 
销售 量 ,数据 如 表 7.1. 1 所 示 : 


表 7.1.1 销售 量 


在 本 例 中 ,我 们 要 比较 的 是 四 种 包装 的 销售 量 是 否 一 致 ,为 此 把 包装 类 型 
看 成 是 一 个 因子 , 记 为 因子 4, 它 有 四 种 不 同 的 包装 ,就 看 成 是 因子 A 的 四 个 
TK FN AL Az Agr Ayo RRR PUES ;个 商店 的 销售 量 记 为 y;;， 
i = 1,2,3,4;] 二 1,2,… ,mi( 在 本 例 中 ,mi = 2,m, = 3,ms = 3,m, = 2), 

由 于 商店 间 的 差异 已 被 控制 在 最 小 的 范围 内 ,因此 一 种 包装 在 不 同 商 店 
里 的 销售 量 被 看 作为 一 种 包装 的 若干 次 重复 观察 ,所 以 可 以 把 一 种 包装 看 作 
一 个 总 体 。 为 比较 四 种 包装 的 销售 量 是 否 相同 ,相当 于 要 比较 的 四 个 总 体 的 均 
值 是 否 一 致 .为 简化 起 见 , 需 要 给 出 若干 假定 ,把 所 要 回答 的 问题 归结 为 一 个 
统计 问题 ,然后 设法 解决 它 。 


7.12 单 因 子 方差 分 析 的 统计 模型 

在 例 7. 1. 1 中 所 考察 的 因子 只 有 一 个 , 称 其 为 单 因子 试验 .通常 在 单 因子 
试验 中 , 设 因子 4 有 个 水 平 4,, 4,,…,A4,, 在 每 一 水 平 下 考察 的 指标 可 以 看 
成 一 个 总 体 , 现 有 7 个 水 平 , 故 有 7 个 总 体 ,并 假定 ; 

(1) 每 一 总 体 均 服从 正 态 分 布 ， 

(2) 每 一 总 体 的 方差 相同 

(3) 从 每 一 总 体 中 抽取 的 样本 相互 独立 。 

那么 我 们 要 比较 各 个 总 体 的 均值 是 否 一 致 ,就 是 要 检验 各 总 体 的 均值 是 
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否 相 同 , 设 第 ; 个 总 体 的 均值 为 上 4, 那么 就 要 检验 如 下 假设 : 
| Hp = Mm="" =p (7.1.1) 
其 备 择 假设 为 : 
H, : pst p AET. 

通常 A, 可 以 省 略 不 写 。 

当 Ho HEIT, A 的 -个 水 平 的 均值 相同 ,这 时 称 因子 4 的 各 水 平邮 无 显著 
差异 ,简称 因子 4 不 显著 ;反之 Ho 不 真 时 ,各 ys 不 全 相同 ,这 时 称 因子 4 的 
各 水 平 间 有 显著 差异 ,简称 因子 4 显著 .图 7.1. 1 示意 了 这 两 种 说 法 的 含义 。 


i | 
| 
| | 
j | 
i | 

j 
| | 
i 


Ha 
(b) ARA 


了 
(a) A 不 显著 


图 7.1.1 两 种 说 法 的 示意 图 

用 于 检验 假设 (7. 1. 1) 的 统计 方法 称 为 方差 分 析 法 , 其 实质 是 检验 若干 
个 其 有 相同 方 老 的 正 态 总 体 的 均值 是 否 相 等 的 一 种 统计 方法 。 在 所 考察 的 因 
子 仅 有 一 个 的 场合 , 称 为 单 因子 方差 分 析 。 

为 检验 假设 (7.1. 1) 需要 从 每 一 总 体 中 抽取 样本 。 设 从 第 ;个 总 体 获得 容 
量 为 me; 的 样本 ya， s Yim, 9 = 1,2," 7, 各 样本 间 还 是 相互 独立 的 ,这些 样 本 
可 以 通过 试验 或 某 种 观察 获得 .为 方便 起 见 , 本 章 对 样本 及 其 观察 值 都 用 同一 
HG y 加 下 标 表 示 , 其 含义 可 从 上 下 文理 解 。 

在 A 水 平 下 获得 的 yi 与 A 不 会 总 是 一 致 的 , 记 

Ej = Yi Pio. 
称 &; 为 随机 误差 ,从 而 有 
Yij = pi F E (7.1.2) 
称 (7. 1. 2) 为 yj 的 数据 结构 式 , 即 来 自 均值 为 4 的 总 体 的 观察 值 y; 可 以 看 成 
是 其 均值 与 随机 误差 迭 加 而 产生 的 .在 假定 As 下 的 指标 yo 服从 N Ga, 0) 
分 布 时 , 则 有 Ej ~ N(0,0°)., 
综 上 ,我 们 有 单 因 子 方 差分 析 的 统计 模型 . 
yj = Mi + Ej» i = 1,2) ,1, j=1,2,.m, 
Z ey 相互 独立 , 且 都 服从 NCO, a?) ma 
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可 在 此 模型 下 检验 假设 (7. 1.1)。 
为 了 能 更 仔细 地 描述 数据 , 常 在 方差 分 析 模 型 中 引入 一 般 平均 与 效应 的 
概念 。 称 诸 Pi 的 加 权 平 均 


lo 
n=- D Mh (7.1.4) 


为 一 般 平 均 , 其 中 一 Dim P 
| a; = 4 — Ps 1=1,2,*",7 (7.1.5) 
为 因子 4 第 ;水 平 的 主 效应 ,也 简称 为 A; 的 效应 ,容易 看 出 效应 间 有 如 下 关系 
式 : 
Dymo, = 0 (7.1.6) 
在 记号 (7. 1.5) 下 ,有 
H; = 1H a, (7.1.7) 
这 家 明 第 :个 总 体 的 均值 是 一 般 平 均 与 其 效应 的 和 欠 加 。 此 时 单 因 子 方差 分 析 
的 统计 模型 可 改写 成 : 
Yy = H Fa; + Eijs 1 = 1,23", =1,2,*.m, 
Smia: =0 (7.1.8) 


各 Es 相互 独立 , 且 都 服从 NCO,0?) 
它 由 数据 结构 式 、 关 于 效应 的 约 东 条 件 及 关于 误差 的 假定 三 部 分 组 成 ,在 模型 
(7.1.8) 下 ,所 要 检验 的 假设 (7. 1.1) 可 改写 成 ， 


H:a; = a; = ""=a,=0 (7.1.9) 
7.1.3 检验 方法 
通常 在 单 因 子 方差 分 析 中 所 得 数据 可 列 成 如 下 形式 : 
H 验 数 E 
A, Yıl Yiz trees Yim, 
A; Yz Yz seee Yrm, 
A, | Jr Yro o seeen Yrm, 


其 中 各 yi; 是 有 老 异 的 ,我 们 从 考察 数据 间 的 差异 着 手 来 给 出 检验 方法 。 
造成 各 yy 间 差 异 的 原因 可 能 有 两 个 :一 个 可 能 是 假设 H, 不 真 , 即 各 水 平 
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下 总 体 均值 (或 水 平 效应 ai) 不 同 ,因此 从 各 总 体 中 获得 的 样本 观测 值 也 有 
差异 . 另 一 可 能 是 五 ,为 真 ,差异 是 由 于 随机 误差 引起 的 。 
为 使 这 些 差异 的 大 小 能 定量 表示 出 来 , 先 引 入 帮 干 记号 : 


把 4 水 平 下 数据 和 记 为 y = Doo 其 平均 值 记 为 到 .== Fy 


(7.1.2) 可 知 ,y. 具有 如 下 结构 式 : 
Yi. = Pi 十 E... (7. l. 10) 


“把 所 有 数据 之 和 记 为 .一 D 了)y, 其 平均 什 记 为 一 2,141 07.1. 8) 


知 ,5 具有 如 下 结构 式 ， i 
y=yøy+e (7.1.11) 


每 一 数据 yy 与 总 平均 的 偏差 可 以 分 解 成 两 部 分 ( 见 图 7. 1. 2): 


A Á, A, A, 


图 7.1.2 例 7.1.1 数据 图 及 偏 整 分 解 示意 图 
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, A A a ae -L 


Yi — Y = (Yy — ya) + Oi — y) (7.1.12) 
其 中 yy 一 yJ. RAAN MU REALIZE : 
Yy — Yi = (y; F Ej) — (u: + E) = Ej — E (7.1.13) 
而 y 一 3 称 为 组 间 偏 差 ,除了 反映 随机 误差 外 还 反映 了 第 i 个 水 平 效应 ， 
Yi — y = (y + E.) — (i+e)=a+e.—e (7.1.14) 
7.1.3.1 平方 和 分 解 式 
各 yi; 间 总 的 差异 大 小 可 用 总 偏差 平方 和 Sr 表示 : 


ST — SS Gr, 7 y) (7.1.15) 


由 随机 误差 引起 的 数据 间 的 差异 可 以 用 组 内 偏差 平方 和 表示 ,由 于 (7.1.13) 
说 明 组 内 偏差 仅 反映 随机 误差 , 故 也 把 组 内 偏差 平方 和 称 为 误差 偏差 平方 和 ， 
记 为 5。， 


S, — DONT — Yi) (7. l. 16) 


上 一】 j=l 


由 于 组 间 侦 差 除了 随机 误差 外 ,还 反映 了 效应 间 的 差异 , 故 由 效应 不 同 引起 的 
数据 差异 可 用 组 间 偶 差 平 方 和 表示 ,也 称 为 因子 4 的 偏差 平方 和 , 记 为 Sa: 


Sa — mi, — yy (7.1.17) 
LEF- MERE m 是 因为 第 i 水 平 有 mi 个 试验 数据 。 
可 以 证 明 上 述 三 个 偏差 平方 和 间 有 如 下 关系 式 : 
Sr = Sa +t S (7.1.18) 
(7.1.18) 式 常 称 为 平方 和 分 解 式 。 这 是 因为 


r 


T =>, ij — y) =>, Y — Yi. 十 Yi. — y) 
j=l ja 


i=] J i= 

= >, > Ou y t OIDO Oyy) O — Y) 
i=] j=1 i=] j=] i=] j=1 

— Se + Sa | 


HF Os 一 y.) = 0, 故 上 述 第 三 项 为 0。 


7.1.3.2 检验 统计 量 及 拒绝 域 
为 了 给 出 检验 方法 , 拟 从 比较 S54 与 S, 着 手 给 出 检验 用 的 统计 量 与 合适 的 
拒绝 域 形式 .为 解决 这 一 比较 问题 , 先 看 看 SA GS. 的 期 望 值 。 
由 模型 (7.1.8) 可 知 各 sj 相互 独立 , 且 ey — NO), i 一 1,2,*",r, 
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了 一 1 ,2 ,… Mis PX 


mo, £ 3 z = ],2, 
E~ NO, Č) 
(1) 求 ES,; 由 于 
230» 一 J)? = -ED E)? ~ X mi; — 1) 


又 由 妇 分 布 的 可 加 性 可 知 
> 一 e O AA — 1)) = X% (a — r) 
由 类 分 布 的 性 质 知 
Ec: z) =n—r 


即 
E(Se) = (n — r)ø’ (7.1.19) 
(2) 求 匹 S4: 由 于 


da 一 DILAGA 一 yy = 之 ma 十 Es. — Ey? 


i=l] 


= ma + mit - në + 2 masa, — £) 


由 于 Ef. 二 0,EE 一 0, 故 i 


ES, = Dima! + Sim EE. ) = EŒ) = Dima! + Dim Zon T 


i=] n 
= ma! +t (ro Do (7. 1. 20) 
1 三 ] 
由 (7. 1. 19) 与 (7. 1. 20) 可 得 
E e mr 02 ， El Sa | 2 1 - 2 > g? 
nor r—l rol 
在 假设 (7. 1. 9) 为 真 时 ,各 a 均 相等 , 且 为 0, 故 有 
Es, 一 g? 
r— 1] 

因此 可 采用 统计 量 
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Sa/ lr 1) 
S.L (n — r) 


来 检验 假设 (7. 1.9) 。 当 H 不 真 时 ,分 子 的 均值 要 比分 母 的 均值 来 得 大 ,因而 
取 如 下 拒绝 域 是 合理 的 


F= (7. 1.21) 


W = {F >c) 
对 给 定 的 显著 性 水 平 a,c PLE 
PCF =>c)=a 
7.1.3.3 临界 值 c 的 确定 
我 们 有 如 下 事实 :上 一 小 自已 证 明了 党 ~ Xa 一 =) ,还 可 证 明 ,在 Ho 
RR ~ Ne(r 一 1), 且 与 5, 相互 独立 ， 
因而 ,由 下 分 布 的 构造 可 知 ,在 五 ,为 真 时 ,《7.1.21) 给 出 的 检验 统计 量 下 
~ Flr —1l.,2 — r) “Rc = Fi-a r — 1,n — r) [EB P(F Èc) = a, 故 得 拒 
绝 域 为 
: W = {F > Fr — 1n—r)) (7. 1. 22) 
AA EA ERAH EC. 1. 21) 的 计算 列 成 一 张 表格 , 称 为 方差 分 析 表 
( 见 表 7.1. 2), 这 里 简称 偏差 平方 和 为 平方 和 ,相应 的 从 分 布 中 的 自由 度 记 在 
目 由 度 这 一 列 中 ,偏差 平方 和 与 自由 度 的 比 称 为 均 方 和 。 


71.2 单 因 子 方 效 分 析 衣 


A Sa fh=rwm1 Va = S4/fa F = V/V, 
e So f.=n—=r V, = S,/f. 


通过 代数 运算 ,上 述 方差 分 析 表 中 的 各 平方 和 可 如 下 计算 : 


r m ro O" 2 
S7= > >04-1*= >) (7. 1.23) 
i=] j=l i=] j=1 


i 5 2 SA y 
Sa 一 2 nOs 一 3)2 = 之 ， A (7.1.24) 
S.=ST—Sa (7. 1.25) 
其 中 y. = X Yis yY.. — > > Yje 
j=1 i=1 j=] 
mE , 作 方 差分 析 的 步骤 如 下 : 
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AE 


(1) 计算 各 水 平 下 数据 和 doi = 1,2,…,7 及 总 和 y..; 


r mi 


(2) 计算 各 类 平方 和 >>， Yis 20 Ima y. /ns 


i=] j= 


(3) 按 公式 (7. 1. 23), (7. 1.24), (7.1.25 计算 各 类 偏差 平方 和 ， 

(4) 填写 方差 分 析 表 7. 1. 2; 

(5) AAA AER a, EF OMR FP Ss O ,并 与 五 值 比 较 大 
小 ,然后 作出 是 否 拒 绝 原 假设 Ho 的 结论 。 

下 面 对 例 7. 1. 1 作 方 差分 析 。 

(1) 由 表 7.1.1 求 得 各 水 平 下 数据 和 与 总 和 分 别 为 ， 

y = 30, ya =39, ys =57, ye =54, y. =180 
(2) 求 各 类 平方 和 


212% 一 3544 2 一 3498 2 = 3240 
1 j Mi n 


以 上 计算 的 列 在 表 7. 1. 3 中 。 
表 7.1.3 例 7.1.1 的 计算 表 


mii Yi- yi. /ms 2 
2 30 450 468 
3 39 507 509 
3 57 1 083 1 091 
2 54 1 458 1 476 
4 
和 n=10 y. =18 J% = 3498 2,21% = 3544 
J m, i 


(3) 由 (7. 1. 23) ~ (7.1.25) 求 得 各 类 偏差 平方 和 为 : 
ST = 3544 — 3240 = 304 
Sa = 3498 — 3240 = 258 
S. = 304 — 258 = 46 

(4) 填写 方差 分 析 表 , 见 表 7. 1. 4。 


表 7.1.4 例 7.1.1 的 方 问 分 析 表 


A 258 3 86 11.22 
e 46 0 1.67 


(5) 1=0.05H,44% Fo0503,6) = 4.76, GEIRA F > 4.76), HL F 
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= 11.22 > 4.76, 故 样本 落 入 拒绝 域 , 即 认 为 四 种 包装 的 销售 量 有 显著 差异 ， 
这 说 明 不 同 包装 受 欢 迎 的 程度 不 同 。 


7. 1.4 效应 与 误差 方差 的 估计 
7.1.4.1 效应 与 误差 方差 的 点 估计 
由 模型 (7. 1.8) DÉ vi HEM, E ys ~ N(y +a) ,因而 可 用 极 大 似 


然 法 求 出 各 效应 与 e 的 估计 。 
EMT DESEES 
_ 二 1 (Yi — mM — a) 
L(f,a,,47,""" 30,10") — 11 U z|- 9g? 
其 对 数 似 然 函数 为 
] F my 
[(4,4,,02,*" 10,0%) 一 一 y (2x0?) 一 202 二 240 ~ p— ay 

似 然 方 程 为 

A 1 r m; 

-= 32 (Yi — MT a) = 

2 O 

2 Z LD ou a a) = t= 1,2, ?了 

t j=1 
a IAE 
207 LOA = 
i=] j 
注意 到 约束 条 件 > ma, 一 0, 则 得 MLE 为 : 
i=} 
=y 
å; = Yi. — Y, 1 = 1,2,*""*»r (7. l. 26) 


H (7. 1.26) PJA 4. = y + a; H MLE Y 
li = y; (7.1.27) 
由 于 Ey = u, EJ: = p = u + ay Eâ; = ai, AM CT. 1.26), (7.1.27) 两 
式 中 各 个 估计 均 为 相应 参数 的 无 偏 估计 。 


但 由 (7. 1.19) 可 知 Eo% = 一 一 0?, 不 是 0 的 无 偏 估计 ,将 它 作 一 修改 可 


n 
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知 , 一 一 是 0? 的 无 偏 估计 ,因而 常用 的 o 的 无 偏 估计 是 
Se 


7.4.1.2 jp 的 置信 水 平 为 1 一 2 的 置信 区间 

利用 第 五 章 的 枢 轴 量 法 ,可 以 构造 上 的 置信 区 间 。 

从 六 的 点 估计 元 出 发 ,由 于 前 已 证 明 考 一 Nr ALO: 
E f, =n — r), H 5. 5 S 相互 独立 ,因而 可 以 构造 一 个 服从 + 分布 的 枢 轴 量 


a? 一 


(7. 1. 28) 


Yi Pi 
o Vm Yi — Fi 
ti 一 -r 10, 
Seyf, INM 


AMA 
P(Jt;| S t1-2 (4.3) = ]— a 


可 得 A 的 置信 水 平 为 1 一 < 的 置信 区 间 为 
LY. — ta e) Z, Ja ti-a (fe) 一 一 - (7. 1. 29) 


Vm Vm 
这 里 5 == 和 /学 ， 
例 7.1.2 ”对 例 7.1.1 各 种 包装 的 销售 量 的 均值 分 别 求 置信 水 平 为 0. 95 


的 置信 区 间 。 
| 解 :首先 求 得 各 种 包装 下 销售 量 均值 的 点 估计 分 别 为 ， 
pA = y. = 15, Lt, = yz. = 13, fa 一 Y3. = 19, Pu = Ya. = 27 
Il fe. = 6, 在 i = 0.05 时 ,to.9s(6) = 2.4469, XH Æ 7.1.44 0 = 7. 67,4 


o = 2.77.4 m; = 2 时 ,to ors (6)6/ Nm: = 4 8m; = 3 时 ,to ors (6)6/ Vm; 一 
3. 9。. 因 此 各 种 包装 下 销售 量 均值 的 0. 95 的 置信 区 间 分 别 为 

m:L15— 4.8,15 + 4.8] = [10.2,19.8] 

fa:[L13 — 3. 9,13 + 3.9] = [9. 1,16. 9] 

#:[19 — 3.9,19 + 3.9] = [15.1,22.9] - 

ju: [27 — 4.8,27 + 4.8] = [22. 2,31. 8] 

为 直观 起 见 , 常 将 各 水 平 下 指标 均值 画 成 一 张 主 效应 图 , 例 7.1.1 的 主 效 
应 图 见 图 7.1. 3( 图 中 各 点 为 对 应 水 平 上 的 3.)。 从 图 上 看 出 第 四 种 包装 的 效 
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图 7.1.3 例 7.1.1 的 主 效应 图 
应 最 高 ,第 二 种 包装 的 效应 最 低 。 


715 重复 数 相同 的 方差 分 析 


当 在 因子 A 的 每 一 水 平 下 重复 试验 次 数 相同 时 , 即 当 mi = ms 一 … 


时 ,上 述 一 些 表达 式 可 简化 ,车 记 每 一 水 平 下 重复 次 数 为 区 , 则 ， 
效应 约束 条 件 (7. 1. 6) 可 简化 为 >)a =0; 
Sa 的 计算 公式 (7. 1.24) 可 简化 为 S4 = LX yi — 2, 
u 的 置信 水 平 为 1 一 a 的 置信 区间 (7. 1. 29) 可 改 为 ， 


o , g - 
—= sd — telfa) 
a y 15 到 


Lyi — tisa (Se) 


其 它 一 切 都 不 变 , 下 面 看 一 例子 。 


| 
GS 


例 7.1.3” 今 有 三 个 工厂 生产 同一 种 机 械 锻件 ,为 比较 这 三 个 厂 生产 的 
锻件 强度 有 无 显著 差异 ,分 别 从 每 个 厂 随机 抽 4 件 , 经 测试 所 得 的 强度 数据 列 


于 表 7.1.5 中 。 
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CR 


7.15 SANAR 单位 :100&g 


T TF 强 E X $ 
A, 115 116 98 93 
As 103 107 118 116 
As 73 89 85 97 


假定 第 i 个 厂 的 强度 — NG) ,i = 1,2,3, 试 作 如 下 分 析 : 

(1) 检验 三 个 厂 的 强度 有 无 显著 差异 ; 

(2) 求 每 一 个 厂 平均 强度 的 置信 水 平 为 0. 95 的 置信 区 间 。 

E: (1) 首先 计算 各 水 平 下 的 数据 和 、 各 类 平方 和 ,它们 都 列 在 表 7.1.6 


XE r= 3,m = 二 4,n = 二 rm 一 12. 
表 7.1.6 例 7.1.3 的 计算 表 


As 115 116 98 93 422 178 084 44 934 
A> 103 107 118 116 444 197 136 49 438 
Az 73 89 85 97 344 118 336 29 884 
和 1 210 493556 124 256 
各 类 偏差 平方 和 如 下 : 
1210 
r = 124256 一 19 = 2247.7 


— 4 — 4210 _ 
Sa = “y X 493556 — 
Se = 2247. 7 — 1380. 7 = 867. 0 


方差 分 析 表 见 表 7. 1. 7。 
E 7.1.7 ATINA 


TE a = 0.05 时 ,Fos(2,9) 一 4.26, 故 拒绝 域 为 
W = {F > 4.26) 
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现在 F = 7. 166 > 4.26, 因 而 在 i = 0. 05 水 平 下 拒绝 五 ,, 认 为 三 个 厂 的 锻件 
强度 有 显著 差异 。 

(2) 为 求 各 厂 平均 强度 的 置信 区 间 , 首 先 求 得 各 厂 锻件 平均 强度 的 点 信 
计 : l 
Ai = y. = 105.5, jo = yz = 111, Mmm = y; = 86 
现 f, = 9, 在 i = 0. 05 Bf, tog (9) = 2. 2622, X HÆ 7. 1.3 %H1 0? = 96. 33,4% 
o = 9. 815, 从 而 


to 0 (9) ° 6/ Mm = 2. 2622 X 9.815/ M4 = 11.1 


Á, Az A 3 


7.1.4 例 7.1.3 各 水 平 的 均值 图 
(图 中 ， 为 丈 , 线 段 表 示 a 的 0.95 置信 区 间 ) 


则 各 三 锻件 强度 均值 的 置信 水 平 为 0. 95 的 置信 区 间 分 别 为 ， 
Am:[L105.5 — 11.1, 105.5 + 11.1] = [94. 4,116. 6] 
12 :1111 — 11.1, 111 + 11.1] = [99. 9,122. 1] 
£3:L86 — 11.1, 86 + 11.1] = [74.9,97.1] 

其 各 水 平 的 均值 图 见 图 7.1.4. 


从 图 中 可 见 A 厂 的 平均 强度 最 高 ,A; 厂 的 平均 强度 最 低 。 
348 | | 


$72 多 重 比 较 


在 方差 分 析 中 ,如 果 经 过 下 检验 拒绝 原 假设 (7. 1.9), 这 表明 因子 4 是 显 
著 的 , 妈 7 个 水 平 对 应 的 指标 均值 不 全 相等 ,但 不 一 定 两 两 之 间 都 有 差异 。 辟 
如 在 例 7. 1. 3 中 ,经 检验 三 个 工厂 生产 的 同一 种 机 械 锻件 的 强度 有 显 着 天 腊 ， 
从 图 7.1.4 看 4: 广 的 平均 强度 最 高 ,4: 厂 的 平均 强度 最 低 ,m -5 y h95% 的 
置信 区 间 没 有 相交 ,这 从 直观 上 表明 这 两 个 工厂 的 平均 强度 确 有 明显 差异 , 那 
么 4 三 生产 的 银 件 强度 与 4; 厂 生产 的 锻件 强度 间 有 无 显著 差异 呢 ? 关 两 者 
有 显 痢 差异 ,那么 当 我 们 需要 高 强度 的 锻件 时 应 向 A 厂 购买 ,如 果 两 者 间 无 
PEZI MLS A; 厂 无 货 供应 时 也 可 向 A 厂 购 买 。 所 以 在 一 些 实际 问题 
中 , 当 方 差分 析 的 结论 是 因子 4 显著 时 ,还 需要 我 们 进一步 去 确认 哪些 水 平 间 
是 确 有 差异 的 ,哪些 水 平 间 无 显著 差异 。 

同时 比较 任意 两 个 水 平均 值 间 有 无 显著 差异 的 问题 称 为 多 重 比 较 , 即 要 


以 显著 性 水 平 ,同时 检验 以 下 | "| 个 假设 ， 
Hj: 一 A; 1ZJ» tsj] = 1,2,° ,7 (7.2.1) 


直观 考虑 , 当 AS 为 真 时 , y. 一 .| 不 应 过 大 ,因此 考虑 如 下 形式 的 拒绝 域 ; 
W = U ly. — y| >c) 


这 里 元. 表示 A 水 平 下 数据 的 平均 值 ,i 一 1,2,……,r。 如 果 给 定 了 显著 性 水 平 
2, 就 要 求 在 | ”| 个 假设 HY 为 真 时 
PW=a 
下 面 分 两 种 情况 来 讨论 临界 值 c 的 确定 方法 ,以 下 涉及 的 符号 都 与 87.1 
”相同 。 


7.2. 1 ”重复 数 相等 场合 的 7 法 
在 因子 4 的 每 一 水 平 下 获得 容量 为 m 的 样本 , 则 样本 均值 二. — Na, 


一 ) 呈 一 1,2,…,r, 且 它们 间 相 互 独立 ,而 且 丈 .与 S. 亦 独立 ,因而 用 全 一 /大 
去 估计 of 时 ,有 
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那么 当 一 切 Hs 为 真 时 ,有 
P(W) = POYA Iy — y| > c}) 
=1 = P(Q UJ- — y| <S 0)) 
= ] — P (maxi y. — y| <c)j) 


= P(max]|y;. — y; | >c) 
ij 


= P| max TA > ziz] 

=P ma | ELLA > 

= p(max( 772) mn 57 2)> 775) 

= Pto tw > Fa = a (7.2.2) 


w 

qr, fe) = te — ta 
这 里 的 tw 与 to 分 别 是 来 自 i(f.) 的 容量 为 > 的 样本 的 最 大 次 序 统 计量 与 最 小 
次 序 统计 量 , 所 以 a(r,f.) 就 是 自由 度 为 f. 的 :分布 的 容量 为 > 的 样本 极 差 , 称 
它 为 上 化 极 差 变量 ,其 分 布 与 因子 的 水 平 数 ~ 及 误差 平方 和 的 自由 度 f. 有关, 该 
分 布 的 分 位 数 表 已 算出 , 列 在 附 表 11 中 .为 使 (7. 2. 2) 所 示 的 概率 为 ,可 取 


C 
A — _alr+,f.) 
5) a qı 


从 而 
c= gialrsf)o/ N m 
综 上 可 知 检验 问题 (7. 2. 1) 的 水 平 为 a 的 拒绝 域 为 / 
{|3:. — 91] > qa rs fJo/ Vm) (7.2.3) 
这 一 方法 最 早 是 由 Tukey 研究 的 ,因而 称 此 法 为 工法 。 

例 7.2.1 在 := 0.05 水 平 下 对 例 7. 1. 3 作 多 重 比 较 。 

解 : 在 本 例 中 ,r = 3,m = 4,f. = 9, 在 i 二 0.05 水 平 下 , 查 附 表 11 可 得 
qo.95(3,9) 一 3.95。 又 由 例 7.1.3 求 得 co = S./f. = 96. 33, 故 o = 9. 815, 从 而 
临界 值 

c = qo.ss(3,9)0/ Vm = 19. 38 
因而 当 i 一 7 时, 如果 | 元 一 .| > 19. 38 则 拒绝 py = py 这 一 假设 ,否则 就 保 
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bir re mot ip PE S PE sh LEH bs Her A 


留 这 一 假设 。 现 从 例 7.1. 3 得 


|y. Ya. | — |105. D 一 111| = 5.5 < 19. 38 ,保留 假设 HS: py 一 Hz; 
Iy. — 73. | = 105.5 一 86| = 19.5 > 19.35, 拒 绝 假设 Ho: = a; 


[F2 一 y| = 1111 一 86| = 25 > 19. 38, 拒 绝 假 设 HS: H2 = fo 
综 上 可 知 , 在 i 二 0.05 水 平 下 和 内 与 Am 间 无 显著 差异 ,而 mA Ss 间 有 显著 
Fo 


marran 


7.2.2 重复 数 不 等 场合 的 $ 法 
为 叙述 S 法 , 先 给 出 对 比 的 定义 。 


定义 7.2.1 Besane 为 > 个 常数 , 且 满 足 >)c = 0, WF L = 


> cm 为 一 个 对 比 ， 

我 们 现在 讨论 的 假设 H5 中 的 p = pj; 也 可 以 看 成 是 一 种 特殊 的 对 比 .各 
Ma = juz 可 看 成 ci = 1,0, 一 一 l,c3 = "Oi 一 0 的 一 个 对 比 。 

对 比 就 不 限于 上 述 的 两 两 均值 的 比较 ,譬如 在 例 7.1.3 PER MTE 


H, AEB — 内 ,这 也 是 -- 一 个 对 比 ， 


Sta hy ta — = O 


BD ci = c: = Le 一 一 1, 


2 


HoL=0 XË] cic: ren Da =o 


法 。 
在 重复 数 msm, m 不 等 的 场合 ， 


Gi — F) — (一 向 一 No, [+ + 1) | 


XEF Dd) 与 9。 独立 ,因而 有 
Qi. -一 Yi) — 07 -一 15) a TER 


nt; m; 


企 Hs 为 具 时 ， 
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m 
— 2 
A 


或 F; = 


m;i m; 
= P(maxF; > 0?) = a (7.2.4) 
, F" 
ESF = maxF"¡, AE) ~ Fir 一 1,0 (参阅 文献 L171), 为 使 
(7. 2. 4) 所 示 的 概率 为 a, 可取 

c 一 (r 一 1) Fiar Oo l, fo 


这 表明 当 


> Y (r => 1)F,-_,Cr T7 1, fe) 
— g 


ml; m; 


时 拒绝 假设 a = p;, 亦 即 当 


g’ 


[y — y| > A 一 1,f0)| 直 十 
时 拒绝 Hs AT 


Ci; 一 A El 


UA AS: = Ai 的 水 平 为 “的 拒绝 域 为 | 
(di. — yl > cy? (7.2.5) 
例 7.2.2 在 显著 性 水 平 ;:= 0.05 下 对 例 7.1.1 作 多 重 比较 。 
解 :在 本 例 中 ,rr 一 4, 放 =6, 宁 一 7.67, 在 z 王 0.05 时 ,Fos(3,6) 一 4.76。 
由 于 Mı = 23M, = 3 m, = 3 m, 一 2 ,所 以 对 不 同 的 17, 检 验 假 设 Hg 的 
拒绝 域 不 同 ， 
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当 m; = 2,m; 二 2 时 ,cw = 3 X 4.76 X + + 1| XX 7.67 二 10.5, 因 
而 检验 HY 的 拒绝 域 为 {|3. — Ya 1 > 10.5), 现 |y. 一 .| 二 12>10.5,%% 


拒绝 HS, UA jn 5 Ha ALEZI. 


Mm = 2,m; = 3H 00) 二 3 X476X| 二 十 二 | x 7.67 = 9.6, 因 


而 检验 HS, AS, HS, HS 的 拒绝 域 为 {|3:. — yl > 9.6) R |y,. — y2.| = 2 
< 9. 6 , (yi — y 3. | =4<X 9.6, Yo. — Ya. | =14>9.6, | 73. — Ya. | =8 <9. 6， 
因此 仅 pj 与 pu 间 有 显著 差异 ,其它 无 显著 差异 。 


当 m; = 3,m; = 3 时 ,c@) =Aa/3 X 4.76 X [++ Ł) x 7.67 = 8.5, 因 


而 检验 H? 的 拒绝 域 为 {|32. 一 3.| >85) M |y — 7| = 6< 8. 5,1% Mo 
与 ys 则 无 显著 差异 ，。 

综 上 ,A 这 种 包装 的 销售 量 明显 高 于 41,4, 这 两 种 包装 的 销售 量 ,与 A, 
包装 间 的 差异 尚未 达到 显著 水 平 , 这 说 明 A 是 最 受 欢 迎 的 包装 。 


"$73 方差 莉 性 检验 


在 方差 分 析 中 要 求 所 涉及 的 7 个 正 态 总 体 的 方差 相等 ,这 一 要 求 被 简称 
为 方差 齐 性 ,这 里 7 是 因子 的 水 平 数 。 如 何 检验 方差 齐 性 ?这 便 是 本 节 要 讨论 
的 方差 齐 性 检验 。 : 

RATrMESARN Cm.) ,i = 二 1,2,…,r, 从 第 i 个 总 体 中 抽取 了 容量 为 


m: 的 样本 ya Yi Yimi， 设 样本 均值 为 Yi = LS yy HAM sí 一 


0, 一 7V MERA EA 


M; — 1 
Ho:ot = 0} = - = ož (7.3.1) 
备 择 假设 H, :01y02 ,°° y 07 不 全 相等 , 它 常 略 去 不 写 。 


下 面 分 两 种 情况 介绍 检验 方法 。 


7.3.1 样本 容量 相等 场合 
Wm =m 一 … =m, 一双 ,常用 的 有 两 种 检验 方法 。 
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(1) RAF 检验 (Hartley 检验 ) 
检验 用 的 统计 量 为 


max{s1,52,*** ,5;} 


F max >> (7. 3. 2) 


min (si,só, +." ,só) 
从 直观 考虑 , 当 假 设 (7. 3. 1) AEI sisi os 中 的 最 大 值 与 最 小 值 不 应 相 
差 过 大 ,因而 取 下 列 拒绝 域 是 合理 的 : 
(F mx > C} 
在 假设 (7. 3.1) 为 真 时 ,对 给 定 的 显著 水 平 a,c ME Pm > c) = a, 
为 确定 临界 值 c, 需 要 求 当 of 二 of 二 … 二 中 会 四 时 Fw 的 分 布 ,注意 到 此 时 ， 
(m — Dst/o? ~ Gm — 1), i = 1,2,…,r, 且 它们 间 还 相互 独立 ,从 而 下, 变 
成 + 个 相互 独立 的 自由 度 为 m 一 1 的 x? 变量 的 最 大 值 与 最 小 值 之 比 ,其 分 布 
与 7,m — 1 有关, 其 临界 值 c 在 附 表 12 中 给 出 ,通常 记 c = Fmi rm 一 1)， 
从 而 检验 问题 (7. 3. D 的 水 平 为 a 的 拒绝 域 为 
W = {Fm > Fmax, -arom — 1)) (7. 3.3) 
例 7.3.1 在 显 着 性 水 平 i = 0. 05 时 检验 例 7. 1. 3 中 三 个 总 体 方差 是 否 
相等 。 | 
解 : 这 里 7 二 3,m 二 4, 在 i = 0.05 时 ,由 附 表 12 查 得 ; 
F max.0.95 (3,3) = 27.8 
因此 用 统计 量 (7. 3.2) 作 检 验 的 水 平 为 0.05 的 拒绝 域 是 
W = {Fux > 27.8) 
现 由 样本 求 得 各 总 体 的 样本 无 偏方 差 为 
$ = 137.7, si=51.3, si 一 100 
max(s?) = 137.7, min{s?} = 51.3 
由 此 求 得 所 ww = 137. 7/51. 3 = 2. 68 < 27.8 ERA ERR, E i = 0. 05 
水 平 上 可 认为 三 个 总 体 方 差 之 间 无 显著 差异 
《2) 最 大 方差 检验 (Cochran 检验 ) 
当 min(s) ~ 0 时 ,用 检验 统计 量 (7. 3. 2) 将 会 导致 犯 第 二 类 错误 的 概率 
很 大 ,Cochran 提出 了 另 一 种 检验 统计 量 ， 
max {s2 s,s. ,si, 


2S 


¿=1 


同样 ,从 直观 上 考虑 , 当 假设 (7. 3. 1) 为 真 时 ,max {sf} AE 中 所 占 比例 不 


Gmax (7.3.4) 
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会 太 大 ,因而 取 下 面 的 拒绝 域 是 合理 的 : 
W = {Gm =C) 
在 Ho. ARM, c 181% P (Gma > 0) = a, Gu HES rom —1 6R, HMA 
É c AAR 13 中 查 出 , 常 记 c = Ca or 门 ,了 = 和 一 1, 从 而 检验 问题 
(7.3. 1) 的 水 平 为 a 的 拒绝 域 为 
W = {Gma => Gmax, ie (17m — 1)) (7.3.5) 
若 对 例 7. 1. 3 用 Gu 统计 量 去 检验 三 个 总 体 方差 是 否 相 等 , 则 由 > 一 3,m 
= 4, 在 1 = 0. 05 时 ,从 附 表 13 可 查 得 Cu.os(3,3) = 0.7977, 其 拒绝 域 为 


(Gmax 2> 0. 7977}. B 7. 3. 1 中 的 数据 可 知 max1fs ) = 137.7, >25 = 289, M 


而 得 Gu = 137. 7/289 = 0. 476 < 0. 7977 ,样本 落 入 接受 域 , 因 此 在 ; 一 0. 05 
水 平 上 可 认为 三 个 总 体 方差 相等 。 | 


7.3.2 样本 容量 不 等 场合 

在 样本 容量 不 等 时 可 采用 下 面 的 Bartlett 检验 。 它 是 从 广义 似 然 比 导出 的 。 

如 本 节 开 头 所 述 ,各 yy 独立 ,yij | NC), i = 1,2 sr j= 132,0", 
mi, 那 么 我 们 可 写 出 似 然 函数 ， | 


Lo = TT] rt O — 109) 
i=] j=] xo? 1 | 
~ - A Ae (Yi 一 p)" 
= [I Cero?) zexp{— D> a 
在 参数 空间 6 = (ass 0 ;07) ;一 00 < pi < 00,067 > 0,1= 1e sr} 


上 ,可 求 得 各 1,0? 的 MLE 为 


mi 

mi — 1 
Qi — y = 5. si 
f 


pi = Yis o? — 
此 时 似 然 函 数 的 极 大 值 为 


Limax — (2x)-z2U CIO 


1 
Mi 52] 


其 中 一 > Mm H, HAN , BA O, = (Ars tots pl 0); 一 00 Xp oo0,， 
i=] 
i = 1 ,2,° ,7 ,0° > 0) ,这 时 各 Hi ka? 的 MLE 为 


st _ J 1 d "i 1 
E 二 一 g? == —>5>-— pj 7 ; 2 — r 
17 y , 2 2 (Y — yi) = Se 
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2 “a A AAA . ... 


似 然 函 数 的 极 大 值 为 
Lomax = (20) 2(0) 2e 2 
从 而 似 然 比 为 


Lmax (32)? 
其 拒绝 域 形 为 {4 <A) MARA 4A 作 一 变换 , 令 


X =— 2ln4=— 25 mn 一 y In a?” 
一 nln g? 一 Smilng 
则 拒绝 域 为 {X > AN .统计 学 家 证 明了 


x= [fin 7 一 > Cn: 一 Dln] >x% (r — 1) (7.3. 6) 
i=] 


其 中 < = g pl pa a E+ 1. 从 而 对 给 定 的 显著 性 水 平 ,拒绝 
RI 
W = {X > Xi-alr — 1)) (7.3.7) 


这 一 检验 在 样本 容量 相等 场合 也 可 用 。 

例 7.3.2 在 显著 性 水 平 i = 0.05 时 检验 例 7. 1. 1 中 四 个 总 体 的 方差 是 

否 一 致 。 

解 : 这 里 m = 2,ms = 3,ms = 3,m = 2, 各 m 不 全 相等 , 故 用 统计 量 
(7. 3. 6) ERE. 

由 于 r = 4, 在 i = 0.05 时 查 叉 分 布 表 得 Xs《3) = 7. 815, 从 而 拒绝 域 为 

= {X = 7.815) 
现 由 样本 求 得 各 上 自 的 无 偏方 差分 别 为 : 
s$i=18, s=1, s$=4, s=18 

又 由 例 7.1.1 知 S. = 46,f, = 


< 一 [本 十 六 十 六 十 十 一 Sa +1=1-3148 


46 
1. 3148 6 
由 于 好 = 2.79 过 7. 815, 这 表明 样本 落 在 接受 域内 ,因此 在 i 二 0.0570 EH] 
以 认为 四 个 总 体 的 方差 相同 ， ( 
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X 一 [6 xin 一 一 lnl8 一 2inl 一 2in4 一 ln18] 一 2.79 


> -5 130 «har Hi 


$74 一 元 线性 回电 


在 一 些 实际 问题 中 ,经 常 需要 我 们 从 定量 的 角度 去 研究 某 些 变量 间 的 关 
系 一般 讲 ,变量 间 的 关系 有 了 两 类 : 

一 类 变量 间 具 有 完全 确定 的 关系 ,它们 可 以 用 遂 数 形式 去 表达 .例如 圆 的 
面积 S 与 半径 RR 有 关 , 一 县 半径 RR 确定 , 则 面积 S 可 通过 函数 了 (R) = rR? K 
出 , 即 S = TR”, 

另 一 类 变量 问 有 关系 ,但 不 能 用 函数 形式 表达 。 例 如 人 的 体重 y 与 身高 z 
有 关 ,一 般 而 言 , 较 高 的 人 体重 较 重 ,但 同样 身高 的 人 体重 却 不 会 都 相同 ;又 如 
居民 的 铺盖 存款 额 y 写 他 的 收入 xz 有 关 , 但 同样 收入 的 人 储蓄 存款 额 也 不 会 
相同 .这样 的 变量 间 的 关系 在 统计 上 称 为 相关 关系 。 

回归 分 析 便 是 研究 变量 间 相 关 关 系 的 一 种 统计 方法 。 


7.4.1 一 元 线性 回归 模型 

为 了 讨论 简便 起 见 , 假定 有 两 个 变量 :z 是 自 变 量 , 其 值 是 可 以 控制 或 精 
确 测量 的 ,认为 它 是 非 随机 变量 ;y 是 因 变 量 , 对 给 定 的 z 值 ,> 的 取 值 事先 不 
能 确定 , 故 > 是 随机 变量 .为 了 研究 > 与 z 间 的 关系 ,首先 就 要 收集 数据 ,下 面 
通过 一 个 例子 来 说 明 。 

例 7. 4.1 我 们 知道 营业 税 税收 总 额 > 与 社会 商品 零售 总 上 额 z 有 关 . 为 能 
从 社会 商品 零售 总 额 去 预测 税收 总 额 ,需要 了 解 两 者 的 关系 。 现 收集 了 如 下 九 
组 数据 ( 表 7. 4. 1)， 

表 7.4.1 社会 商品 零售 总 额 与 税收 总 额 单位 : 亿 元 


FE 社会 商品 零售 总 客 营业 税 税收 总 额 
_ T y 


3. 93 
9: 96 
7.85 
9. 82 
12. 50 
15. 55 
15. 79 
16. 39 
18. 45 


O 0O Ny D A A w 二 
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通常 将 上 述 数据 记 为 (zi,y;) s 一 1,2,… ,7n, 本 例 n = 9。 为 了 直观 起 见 ， 
可 将 这 对 数据 作为 平面 直角 坐标 系 中 个 点 ,将 它们 点 在 zx 一 y 平 面 上 得 到 
一 张 “ 散 点 图 ”. 本 例 的 散 点 图 见 图 7.4.1. 


100 200 300 400 
E 7.4.1 例 7.4.1 的 散 点 图 
观察 n 个 点 在 图 中 的 散布 情况 ,发 现 本 例 的 9 个 点 散布 在 某 直 线 7 附近 。 
从 而 我 们 可 以 认为 观测 值 y 由 两 部 分 迭 加 而 成 :一 是 随 z 的 变化 而 呈 线 性 恋 
化 的 趋势 ,用 Bo + fx 表示 ;二 是 其 它 随 机 因素 影响 的 总 和 ,用 ERR MA y: 
的 数据 结构 式 ， 


Yi = Po + Pit: + Es) 1=1,2,*"*s2 
其 中 poh 为 未 知 参 数 , 称 它们 为 回归 系数 有 时 还 专 称 p 为 回归 常数 ,各 & 
是 不 可 观测 其 值 的 随机 误差 ,通常 假定 E — N00), H E ,ez,…,e, 相互 独 
芯 。 综 上 所 述 ,可 得 如 下 一 元 线性 回归 模型 
yi = Po + Piti + €)» i=1,2,.,n 
各 s 相互 独立 , 且 都 服从 N(0,c2) 
由 (7.4.1) 可 知 ,y; 一 N (Bo 十 pro 一 1,2 on, H yis yo 为 相互 独 
LXE y 既 表 示 随 机 变量 , 又 表示 其 观察 值 ,本 闻 都 是 这 样 。 
略 去 下 标 2, 则 


(7.4.1) 


E(y) = po Ba (7. 4. 2) 
这 便 是 > 关于 z 的 一 元 线性 回归 函数 ,其 在 z 一 > 平面 上 的 图 象 便 是 一 条 直线 
(如 图 7. 4. 1 中 记 为 /的 直线 ) ,PB 是 直线 的 斜率 ,表示 zz 增加 一 个 单位 时 ECy) 
的 增加 量 ,B。 是 直线 /在 y 轴 上 的 截 距 。 由 于 (7. 4. 2) 中 BA 未 知 , 故 需 要 我 
们 从 收集 到 的 数据 出 发 进行 估计 。 若 记 Bor Br 为 其 估计 , 则 称 
y=B + Bra (7. 4. 3) 
为 y 关 于 的 一 元 线性 回归 方程 有 了 p。,p 可 将 图 7. 4. ES 
它 实际 上 是 作为 (7. 4. 2) 图 象 的 一 种 估计 。 
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7.4.2 ”回归 系数 的 最 小 二 乘 估计 

估计 回归 系数 Bo A 的 一 个 直观 想法 便 是 要 求 观测 值 % 与 其 均值 Bo 十 
Br 的 偏离 越 小 越 好 ,为 避免 正 负 偏差 抵 销 , 可 要 求 如 下 的 偏差 平方 和 @ 达 到 
最 小 : 


QC) = ` (yi — Bo — Bird” (7.4.4) 
i=] 


即 要 求 估计 Bor 8 满足 
Q(B ,P1) 一 minQ (po, $1) 


由 于 Qs BO 是 一 个 非 负 二 次 型 ,对 Bos A 的 偏 导 存在 ,因而 可 通过 令 @ 对 
Bos Br 的 偏 导 为 零 来 求 . 现 有 


R =-29)0= 一 Bix:) = 0 
(7. 4. 5) 
> = 一 25 Gr — Bo — Bixar; = 0 
i=1 
经 整理 有 
nB, + nz. Ê; = ny 
n n (7. 4. 6) 
nzpo 十 > ib, 一 Y UY 
i=} i=] 


称 (7.4. 5) 为 正规 方程 组 .由 (7.4. 6) 的 第 一 式 可 得 
Bo = 一 y. — Pz 


pe 


将 其 代入 (7.4.6) 的 第 二 式 , 有 
( 2 7 一 nz’)p 


Nay — NI Y 
(以 后 “ >)” 常 简 记 为 “ >,”) 记 
¿=l f 
la = Dad — n? = 2) (zi — T) = 之 一 (Dz) 
lay 一 2 Tiy: — MTY = 2% — T) (Y: — y) (7.4.7) 


一 = D T: — LO 
HE 2 Lg," Tp 不 全 相等 ， W a Æ 0， 便 可 解 得 


| laz | (7.4.8) 
y 
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可 验证 (7. 4.8) 使 (7.4. 4) 达到 最 小 , 故 称 (7.4. 8) 为 Bi ,Bo HE NARA TT > 
EA RWI LSE, | 

从 (7.4.8) 可 知 , 求 ,6 MEAR An PAPERS: 

(1) RHE D t > y 及 元,7i 

(2) 求 出 E 2 Tyi tk C. 4. D da 5 lay; 

(3) 按 (7. 4.8) RH Â 与 ,并 写 出 回归 方程 

y 一 Bo + Bra 
例 7. 4. 1 的 计算 常 列 成 如 表 7. 4. 2 那样 的 计算 表格 ,其 中 = >) O 一 


用 一 Dia = Dei LO AA TERA. 


表 7.4.2 例 7.4.1 的 计算 家 


Sz: = 2600. 55 n=9 >S, y: = 106. 24 
z = 288.95 y = 11. 8044 
> 12? = 837272. 4111 S, Tiyi = 34876. 7147 Y = 1465. 4326 
1 1 1 
A O? A DE ~ 29 

= 751428. 9225 = 30698. 0480 = 1254. 1042 
laz 一 85843. 4886 lay = 4178. 6667 ly, = 211. 3284 


B, = q = 0. 0487 
Bo = y — Biz =— 2.2675 


.. y 一 — 2. 2675 + O. 0487x (7. 4. 9) 


从 回归 方程 (7. 4. 9) 可 知 , 当 社 会 零售 总 额 增加 1 亿 元 时 ,营业 税 税收 总 
额 增 加 0. 0487 亿 元 ,这 便 是 应 的 含义 .对 本 例 来 讲 记 < 一 0 不 能 作出 实际 解释 ， 
因为 = 一 0 时 该 方程 是 无 意义 的 . 故 要 注意 (7. 4.9) 仅 在 z 的 某 一 范围 内 成 
立 , 通常 在 Lzo ,zm] 和 附近 区 域内 方程 有 意义 的 ,而 超出 这 范围 要 具体 分 
析 ,其 中 LD Tm 分 别 为 Tistg" 3 Tn 中 的 最 小 值 与 最 大 值 。 

KH poh 的 最 小 二 乘 估计 后 ,应 写 出 回归 方程 , 它 常 有 两 种 表示 方式 ， 

=P + Êz = 7 + f(x — T) 
这 表明 回归 直线 必 过 两 点 (0,Po) 5,7”. 
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7.4.3 “最 小 二 乘 估计 的 性 质 
设 由 数据 (xi,yi) ,1 二 1,2,… ,nn 求 得 模型 (7. 4.1) 中 Bobi HER 


Y BoA AEETI EBES = ĝo -+ iz, PK Fi 一 Bo + Pz, HET — x; 处 
的 拟 合 值 ( 或 回归 值 ), 称 e; = yy — 3 HARE ii 二 1,2,*…,n,SE = 2 Ci — 30)" 
称 为 残 差 平方 和 .我 们 有 以 下 一 些 性 质 ， 

定理 7.4.1 在 模型 (7. 4.1) 下 ,有 


g? 
Dé, ~ N| 8, E) (7. Å. 10) 
=2 
A | 0 (7. 4. 11) 
(3)Cov (Â, Ê) 一 一 Zo (7.4.12) 


证 :利用 了 Cx — 2) = 0, 可 把 房 改写 成 诸 y; 的 线性 函数 形式 , 妈 


l Ti XI 


1 一 J = 2 L Yi 
可 见 , 刀 是 独立 正 态 变量 yj,y;,…,y, 的 线性 组 合 , 因 此 l 仍 服从 正 态 分 布 ， 
由 于 正 态 分 布 仅 由 其 均值 与 方差 决定 , 故 由 


EB, = >) En = (Bo + Pir) 


= pb ” 2, uir = f, 


Var(B,) = S Var) = a 
因而 有 (7. 4. 10) .同样 也 可 改写 Bo, 
bo =53— Pz= >) 
可 见 , 记 也 是 正 态 变量 的 线性 组 合 , 故 由 
Eb, = Ey — EB » z = $, + Bix — Biz = Ba 
Var(B.) = 2, 


-|t E] 
因而 有 (7.4. 11) 。 利 用 协 方差 的 运算 性 质 有 


1 
n 


1 Aj T T 2 
m z z Var(y;) 


A A A a] 


Cov (Â, Bi) = 一 Cov| 2 A Le Y = 天 Zy 
-i ee 
Zo 2 


故 (7.4. 12) 得 证 。 


由 以 上 三 点 可 知 包 、 记 分 别 是 记 、B 的 无 偏 估计 ,但 除了 = 0 外 ,通常 估计 


E Po SP, EHX, 4 z > o0 t, A 5 A 负 相 关 , 当 环 二 0 时 ,po 与 户 正 相关 。 
定理 7.4.2 在 模型 (7.4.1) 下 ,有 


(1)SE/0° ~ X (n — 2); (7.4.13) 
(2)Sg,Pi,y 相互 独立 。 (7. 4. 14) 


证 明 :首先 考察 残 差 平方 和 Sx, 考虑 到 (7. 4.1) 和 (7.4. 8) ,我 们 有 : 
Se 一 2/0 — ĵi)’ = 210 — Bo — Bra,” 一 2[y y 局 (zi — z) Y 


一 240 — y) 一 Mc — E) Y; — y) 十 ĝi >, Cx; — 7) 


= Di = SE Zy) 
J 
对 V19V2 9 Yn 作 线 性 变换 , 令 ~ 


Z; = 41191 十 aiz Y2 十 ... + Ain Yn 1 = l, 2 ,n — 2 


-1 一 Tate y, 


(7.4.15) 
Zn 一 a+ ty, + 十 Yn 
Vn Vn Vn 
其 中 各 Aijst — 1,2," sn 一 29] — 1,2," „n 满足 如 焉 条 件 : 
Ya = 0, Pas = 1, Daya, =0 i 一 1,2 2 一 2 
j=l 
Nasa = 0 i£ k, tk = 1,2". n— 2 
j=1 
(7.4.16) 
则 
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由 于 yis yes oyn 相互 独立 ,都 服从 正 态 分 布 , 所 以 各 Z: 也 都 服从 正 态 分 
布 ,计算 各 Z 的 期 望 . 方 差 及 协 方差 ,利用 (7.4.16) 有 : 
E(Z)=0, Var(Z>) = ø, ¿=1,2,"".n— 2 
EZ ai) = BN las, VartZa-1) = 0 
E(Z,) =s n (Bo + Aj), Var(Z,) = 0 
Cov (Z; ,Z;) = 0 1X% J， ls] 一 1 ,2 7 
这 表明 Lı VAT DA 相应 独立 ,月 L19L A 都 服从 N(0,o2) AH, 


fa aee E 独立 同 分 布 , 故 有 | 


O 


Se/0 一 2) ~ X’ (n — 2) 


一 1 


又 Z, 一 VARE 一人/ n7, Za 一 2 > 一 Nla ZKH 
是 Zn PRO, Â E Z, AR, Sr EZ, Zn 的 函数 ,由 21,Z,,… ,2Z, 的 独 
立 性 知 Ss, 凡 ,7 三 者 相互 独立 。 
由 这 一 定理 的 (7. 4.13), 可 知 E(S 2/0?) =n — 2, 从 而 
02 一 2e (7. 4. 17) 
E o WA. 


7.44 回归 方程 的 显著 性 检验 

从 最 小 二 乘 估计 表达 式 (7. 4. 8) 知 ,只 要 给 出 了 nn 组 数据 (zy)， = l, 
202 , 轧 可 将 它们 代入 (7. 4. 8) 获得 B 与 B 的 估计 ,从 而 写 出 回归 方程 .但 
这 个 回归 方程 是 否 有 意义 呢 ? 当 然 可 以 从 散 点 图 去 观察 , 当 nn 个 点 散布 在 某 直 
线 附 近 时 认为 方程 是 有 意义 的 。 然 而 什么 叫 在 某 直 线 “ 附 近 ” 呢 ?用 眼睛 看 会 
因 人 而 录 ,为 此 需要 有 个 检验 准则 。 

为 作 检 验 ,首先 要 建立 假设 ,我 们 求 回 归 方 程 的 目的 是 要 去 反映 y 随 z 变 

363 


化 的 一 种 统计 规律 ,那么 如 果 PB = 0, 从 (7.4.2) 可 知 ,不 管 x 如 何 变 化 ,Ey 不 
会 随 之 而 改变 ,在 这 种 情况 下 求 出 的 回归 方程 (7. 4. 3) 是 无 意义 的 ,所 以 检验 
回归 方程 是 否 有 意义 的 问题 转化 为 检验 下 列 假设 是 否 为 真 : | 
H.: PB, =0 (7.4.18) 

下 面 介 绍 三 种 第 用 的 检验 方法 ,使 用 时 可 选择 其 中 之 一 。 

7.4.4.1 FRE | 

这 一 方法 类 化 于 $ 7.1 介绍 的 方差 分 析 的 想法 ,也 是 从 观察 值 的 偏差 平 
方 和 分 解 入 手 。 

(1) 平方 和 分 解 

我 们 观测 到 的 wm 92) 的 差异 可 以 用 总 偏差 平方 和 表示 


Sr 一 D O: — y), fr=n—] (7. 4. 19) 


其 中 了 二 二 了 yi。 造 成 这 一 差异 的 原因 有 如 下 两 个 方面 ， 
一 是 由 于 假设 PB = 0 不 真 ,从 而 对 不 辣 的 x 值 ,Ey 随 xz 而 变化 ,我 们 可 以 
用 下 列 偏差 平方 和 来 表示 由 此 引起 的 差异 ， 
SR 一 2: — y (7. 4. 20) 
其 中 Y — Bo + Biz = y + Pz, 一 T), 一 1,2,… sn., H F 
Sk = $, GO y = DA — m1 S Alae (7.4. 21) 
从 (7. 4.10) 可 知 , 其 期 望 值 
ESr = EĞ > la = [(EB)? + Var (BJ. 
= fila + 0? (7.4. 22) 
这 便 表 明 Sa 中 除了 误差 波动 外 ,反映 了 由 p o 所 引起 的 数据 间 的 差异 , 称 
《7.4. 20) 为 回归 平方 和 ,其 自由 度 fs = 1. 
二 是 由 其 它 一 切 随 机 因素 引起 的 差异 , 它 可 用 残 差 平方 和 


Sg = 2,0: 3,7 (7. 4. 23) 
表示 。 由 定理 7.4.2 知 Se/o? — 3 Un 一 2), 于 是 
ElSe) = (n — 2)0° (7. 4. 24) 


残 差 平 方 和 也 称 剩余 平方 和 ,其 自由 度 fe=n-2, 
利用 (7.4.5) 有 2 (yi 一 加) 一 0， 2y Yi 0 = 0, 从 而 有 下 列 平方 和 


分 解 式 ， : 
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ST = > Qi yy = Xoi hth yy 
= 5 wm t 2,6: y 
= Se + e (7. 4.25) 


(2) 检验 统计 量 与 拒绝 域 
MU. 4.22) 与 (7. 4.24) 可 知 , 在 8 = 0 为 真 时 ,SR 与 Sa 一 2) 都 是 
的 无 偏 估计 ,而 在 Bi Æ 0 时 ， 


ECSA) = Bl +0 > P ETE 
因而 及 用 检验 统计 量 
Sa 
F 一 S 7 二 2 (7.4.26) 
检验 假设 (7.4. 18) HF, Rein PERRA 
(F >c) 
对 给 定 的 显著 性 水 平 ,在 8, = 0 的 假定 下 ,c 应 满足 
P(F 2c)=a (7. 4. 27) 
(3) 临界 值 的 确定 
由 定理 7.4.1 知 房 NB) ,在 Bi 二 0 时 有 
Ê, 
of/ Nla 
Bp Pila — $2 1) 


X HEM 7.4. 281 85/0?— Xan — 2), HH S: 5 Ê MATERNA S:t Se 相 
互 独 立 , 从 下 分 布 的 构造 可 知 ,在 BL = 0 时 有 


Sr 
AR e 
z/n — 2) 


从 而 (7.4. 27) 中 的 c= 二 Fi- n 一 2)。 由 此 可 得 检验 假设 (7.4.18) 的 a 水 平 
的 拒绝 域 为 
(F>F,-.(1,n — 2)) (7. 4.28) 
以 上 求 检 验 统计 量 的 值 的 过 程 也 常常 列 成 一 张 方差 分 析 表 ( 表 
7. 4. 3) 。 
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表 7.4.3 方差 分 析 表 


1H SR | fr=1 Vr = Sr/far pa LE 

着 SE E=n>Z Vi = Se/f E Ve 

计 

其 中 fr Ses Sr TIIRA Sr Se Sr W EAR., REE mA Aia 
下 进行 : 

Sr = lp = 20 = y) 一 2,Y — A yo? 


E 


SR -一 Pla — Bilz, 一 lsr 
SE -一 Sr =— Sp | 
下 面 我 们 对 例 7. 4.1 作 回 归 方 程 的 显著 性 检验 、 
由 表 7.4. 2 知 


Sr = l, = 211. 3284 
Sr = ilay = 0. 0487 X 4178. 6667 = 203. 5011 
SE = 211. 3284 — 203. 5011 = 7. 8273 

其 方差 分 析 表 见 表 7. 4. 4。 


E 7.4.4 例 7.4.1 05 %9HX% 


归 , 


203. 5011 1 203. 5011 181. 99 
差 7.8273 7 1.1182 


计 | 232 | 8 | 


拒绝 域 , 故 拒绝 p = 0 的 假设 , 即 认 为 回归 方程 有 显著 意义 。 
7.4.4.2 :检验 


由 定理 7.4. 工 知 房 M8, E) ,假设 (7.4. 18) 相当 于 检验 正 态 分 布 的 


1 回 | 济 


均值 是 否 为 0, 在 8, = 0 时 ， bs — NO, DERF o RA, H HiH o = 
GIN lo 
Se/(n 一 2) 去 代替 , 则 根据 定理 7.4.2 知 Sr/cz — Xn 一 2), 又 与 有 独立 ,从 
而 在 B = 0 时 
366 


p= AA AN (7. 4. 29) 


因此 我 们 也 可 采用 (7. 4. 29) 的 :1 统计 量 作 检验 ,对 给 定 的 显著 性 水 平 a， 
拒绝 域 为 
t| > tyz (n — 2) (7. 4. 30) 
实质 上 :检验 与 F 检验 是 等 价 的 ,这 里 二， 
对 例 7.4. 1 来 讲 , 若 采用 上 检验 , 则 在 ; = 0.05 水 平 上 ,to ws(7) = 2. 365， 
则 拒绝 域 为 {|t| > 2.365) HAHXR7.4.241:8, = 0.0487,1,. = 85843. 4886, 
HÆ 7.4.4 知 o = Y 1.1182 = 1.0574, 
， 0. 0487 
1. 0574/ V 85843. 4886 
由 于 le] >2. 365, 故 样本 落 入 拒绝 域 ,因此 拒绝 8, = 0 的 假设 ,认为 回归 方程 
是 显著 的 。 
7. 4.4.3 相关 系数 检验 
DEE (riy) i = 1,2,… ,7 的 相关 系数 定义 为 
>，(zo — DO — Y) ) 


r = TY 


, | >, 《zi 一 z) >), (Y; 一 y) v Lal yy 


这 是 一 个 统计 量 ,我 们 也 可 以 用 > 来 检验 假设 五 。: h = 0。 


— tay -一 lzy J= — B J= 
Ai O la ly e lyy 
从 直观 上 可 知 , 当 五 ,为 真 时 ,| 已 | 应 较 小 ,从 而 |r| 应 较 小 , 当 |r| 较 大 时 ,就 
应 拒绝 及,, 因 而 可 取 如 下 形式 的 拒绝 域 ， 
{lr| =c) 


在 给 定 的 显著 性 水 平 a 下 ,c 应 满足 PU rl > 0 = a。 
由 于 统计 量 7 与 (7.4. 26) 中 给 出 的 统计 量 下 有 如 下 关系 : 


= 13.49 


o PS 
la yy ST 于 二 SE 1 p 2 , (n — 2) 
R R 


1 
+= 
PJ W sr’ é F ARR K, A AE e 可 以 Qn 一 2) 的 分 位 数 获得 , 它 与 
n 一 2 有 关 。 为 方便 起 见 ,已 将 r 分布 的 分 位 数 制 成 了 表 ( 附 表 14), 记 c= 
rita 一 2), 
因而 检验 (7. 4.18) 的 水 平 为 e 的 拒绝 域 是 
r| > rian — 2)) (7. 4. 32) 


对 例 7.4. 1 来 讲 ,用 > 作 检 验 时 ,在 < = 0. 05 水 平 上 »70.975 (7) = 0. 6664, 
WEEE jr | > 0. 6664), XA : 9 对 数据 间 的 相关 系数 若 不 低 于 0. 6664, 
那 就 在 a = 0. 05 水 平 上 ,认为 它们 之 间 存 在 线性 关系 。 现 由 表 7.4. 2 可 求 得 


4178. 6667 
r= = 0.98 
vV 89843. 4866 X 211. 3284 


由 于 0. 98 > 0. 6664, FERI A EER, E 8, = 0 的 假设 ,认为 回归 方程 是 
显著 的 。 

从 上 述 叙 述 可 以 看 出 ,检验 Ho + Bi = 0 的 三 种 方法 ,彼此 是 等 价 的 ,使 用 
时 看 哪 一 种 方法 计算 量 少 ,就 用 哪 一 个 。 


7.4.5 利用 回归 方程 作 预 测 

当 求 得 了 回归 方程 3 = po 十 Bz, 并 经 检验 ,方程 是 显著 的 , 则 可 将 该 回 
归 方 程 用 于 预测 。 

所 谓 预 测 是 指 当 x = zo 时 对 相应 的 y 的 取 值 yo 所作 的 推断 。 由 模型 知 ,y， 
= Po + Bio + & 是 一 个 随机 变量 ,要 预测 随机 变量 的 取 值 是 不 可 能 的 ,只 能 
AMET EGO) EMER 7. 4. 1 中 , 当 社 会 商品 零售 总 额 x = 300 亿 元 
时 营业 税 的 税收 总 额 是 多 少 难以 预测 ,但 平均 税收 总 额 是 可 以 预测 的 .这 种 统 
计 推 新 有 两 类 :一 是 给 出 E(yo0) 的 估计 值 , 也 称 为 预测 值 ; 另 一 个 是 给 出 Yo 的 
一 个 预测 区 间 。 

由 (7.4.10) 一 (7.4.12) EJA, E xz = zo 处 的 回归 值 是 为 = Bo + lito, 
H 


2 
So ~ N| Ba + Bao» | l + Y °| (7. 4.33) 


n laa 
因而 是 相应 的 期 望 值 ECyo) = Bo + Bizo 的 一 个 无 偏 估计 , 它 就 是 预测 值 。 
然而 在 zx = zo 时 ,随机 变量 yo 的 取 值 与 预测 值 加 总 会 有 一 定 的 偏离 ,可 
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要 求 这 种 绝对 偏差 | yo 一 加 | 不 超过 某 个 和 的 概率 为 1 一 a, 其 中 a 是 事先 给 定 
的 (0 二 a 二 1), 即 
P(lyo — Yol S) =1 —a 
或 
PY —0<y<Y% +0)=1-—a 

MERL Yo — 0, 0 + 01H yo 的 概率 为 1 一 a 的 预测 区 间 , 在 给 定 a 后 ,如 何 来 求 
A 听 ?首先 注意 到 yo 与 yY ,yr 是 相互 独立 、 同 方差 的 正 态 变量 ,并 且 还 有 

(1) 由 (7.4.33) 知 yo — Yo ~ N| ofi 十 一 十 a a] ; 

(2)Se/P ~ X(n — 2); 

(3) HF So = B, + Bizo = y + B Czo — Z) , HEAT A AN, Se 与 和 独立， 
从 而 Se 与 — Yo 亦 独 立 。 

由 此 可 构造 一 个 i 变量， 

Yo 加 Yo 


— Ty | 
oN1+ 寺 + z) o 
A -一 一” 3 二 > ~ tln 一 2) 
_ F yl 
Elí 2) pit ZA 
o n { 


其 中 他 CE ,由 (7.4.17) 知 , 它 是 地 的 无 偏 估计 , 记 5 = ~ 更, 从 而 由 
Yo — Yo 
Plly — Hol <0) = P 4 1 + 2 
< 9 
查 上 分 布 表 可 得 


_ 2 
故 Ô = lx) = s(n — 281 + + + 一 (7. 4. 34) 


H (7. 4. 34) 知 ,y 的 概率 为 1 — “的 预测 区 间 的 长 度 28 SPEE n.r 的 
偏差 平方 和 7、zo 到 三 的 距离 |z。 一 去 | 有 关 。 当 4 较 大 ,1 较 大 (这 表示 各 zi， 
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Lor 较为 分 散 ), |zo — T) 较 小 时 ,6 也 较 小 ,此 时 预测 的 精度 较 局 , 当 o 
RIA, MBE AA, a MEL ,zeoj] 区 间 外 时 ,预测 精度 可 能 变 得 很 
差 ,在 这 种 情况 做 外 推 ,需要 特别 小 心 。 男 外 , 硅 各 Zz,7Xs，… a ARA, A 
É lzz 就 较 小 ,从 而 也 会 导致 预测 精度 的 降低 ,从 这 里 可 见 , 知 要 用 回归 方程 作 
预测 ,在 收集 数据 时 要 使 各 zi ,Tz;,… ,Zz, 尽量 分 散 , 这 对 提高 预测 精度 有 利 . 在 
不 同 的 x 值 上 预测 区 间 的 示意 图 见 图 7. 4. 2. 从 图 7.4.2 可 见 , 在 之 = 未 处 预 
测 区 同 长 度 最 短 , 远 离 工 的 预测 区 间 愈 来 您 长 ,其 预测 区 域 两 头 呈 喇叭 状 。 


y 


图 7.42 预测 区 间 


当 较 大 时 ,t-3(n 一 2) 可 用 标准 正 态 分 布 分 位 数 -s 近似, 若 £o T| 
也 较 小 , 则 此 时 在 不 同 的 ze 上 有 
Ô © uao (7. 4. 35) 


2 


此 时 yo 的 概率 为 1 一 a 的 预测 区 间 的 示意 图 见 图 7.4. 3, 其 预测 区 域 呈 带 状 ， 


图 7. 4.3 近似 预测 区 间 


现 对 例 7. 4. 1 预测 社会 商品 零售 总 额 = = 300 亿 元 时 的 营业 税 的 平均 税 
收 总 额 ,由 (7. 4.9) 可知 预测 值 为 
Yo 二 一 2.2675 + 0.0487 X 300 = 12. 3425( 亿 元 ) 
Æ i = 0.05 时 ,由 zt 分 布 表 查 得 to0.91s(7) = 2. 365, BÆ 7.4.2 知 n= 二 9,7,, = 


85843. 4886, 工 = 288. 95, 由 表 7.4.4 知 o= a] 7 = V 1. 1182 = 1. 0574, ÈE 
E 
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们 代入 (7. 4. 34) 有 


(300 — 288. 95) 


Ô = 2.365 X 1.0574 X 9 35843. 4886 


= 2. 6377 
则 在 z = 300 时 平均 税收 总 额 的 概率 为 0. 95 的 预测 区 间 是 
[12. 3425 — 2. 6377,12. 3425 十 2. 6377] = [9. 7048,14. 9802] 

如 按 (7.4. 35) IRA AAA AAN K a, Æi = 0. 05 BF ¿0.9175 = 1. 96, W 

ô =~ 1.96 X 1.0574 = 2.0725, 从 而 概率 为 0.95 的 近似 预测 区 间 为 
[10. 270, 14. 415] 

在 本 例 中 由 于 x 一 9 较 小 , 故 用 近似 的 方法 求 得 的 概率 为 0. 95 的 预测 区 间 S 
精确 的 预测 区 间 相 差 较 大 。 


7.46 重复 观察 (试验 ) 的 情况 

前 面 在 检验 回归 方程 的 显著 性 时 , 仪 仅 告诉 我 们 z 的 一 次 项 对 y 的 影响 
是 重要 的 ,但 它 并 没有 告诉 我 们 ,x 或 e“ 等 是 否 对 3y 的 影响 就 不 重要 了 
从 这 个 意义 上 讲 , 回 归 方 程 是 显著 的 还 不 等 于 讲 用 y 关于 的 一 元 线性 回归 
方程 拟 合 这 组 数据 已 是 最 好 的 了 .因而 希望 进一步 检验 假设 

Ho:Ey = Bo + Rir (7. 4.36) 

当 Ay 为 真 时 ,可 认为 一 元 线性 回归 方程 是 拟 合 得 好 的 ,否则 需要 进一步 去 分 
怕 原 因 , 或 许 要 进一步 去 寻找 y 与 z 之 间 更 合适 的 回归 方程 的 形式 , E 
E(y =a + brt ce $, 

为 检验 假设 (7.4. 36) 需要 在 同一 z 下 对 y》 作 重复 试验 或 重复 观测 ， au 
得 数据 为 

(Lis yi t = 1,2, ,.253 3 = 1,2,*.m 

其 中 至 少 有 一 个 m > 2E N = >m, 


i=] 


此 时 在 假设 Ho 为 真 时 模型 为 
= Bo + Biz: + €» 2 =1,2,**,n33 = 1,2, ,m; 
各 E 相互 独立 , 旦 都 服从 NC0,0?) 


为 讨论 假设 五 是 否 可 接受 ,我 们 还 是 从 平方 和 分 解 入手 。 各 yo 间 的 差异 
可 以 用 总 偏差 平方 和 Sz 表示 
s- Ebo fr= Dm 1=N-1 (7.4. 37) 
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(1) 反映 x -在 变动 时 引起 各 di ME 它 作 线性 变化 的 部 分 , 记 为 Sr: 


Sr = NG 一 yy (7. 4. 38) 
其 中 y 是 根据 这 N 组 数据 求 得 一 元 线性 回归 方程 3 > 一 记 十 Ahz 后 得 到 的 拟 
AE: = Bo + ixi = 1,2," 

(2) 残 差 平方 和 Se 一 Sp — Sr HUAT y 随 z 线 性 变化 以 外 一 切 原因 
引起 的 波动 ,有 真正 的 误差 ,也 有 xz 对 yy 的 非 线 性 部 分 的 影响 ,如 zz? 0 07, e” 
等 。 为 此 我 们 将 Ss 再 进行 分 解 。 由 于 在 同一 z 下 有 重复 数据 , 故 组 内 偏差 平方 
FLIA T REOLIR , UN So: 


S. - DO 30 ， f. = Dm — 1) =N ~an (7. 4.39) 


RP y: 一 二 oo 1,2, ARES. REVIA AREA Y 


Se 后 剩 下 的 认为 Ses: 
Sif = Se — Ses fi =fe-f.=n-—2 (7. 4.40) 
它 有 反映 了 工 对 y 可 能 存在 的 非 线 性 的 影响 部 分 , 称 Swj 为 失 拟 平方 和 , 它 表 示 
用 y 关 于 的 一 元 线性 回归 方程 去 拟 合 这 些 数 据 拟 合 得 不 够 的 部 分 。 
可 采用 检验 统计 量 


_ Sul jy | 
F, — SÍ. (7.4.41) 


RP Se =N — n, fis = fs 一 f。 仍 从 直观 考虑 , 当 用 线性 回归 拟 合 数据 不 好 时 ， 
Sz 必定 相对 于 5. 来 讲 要 大 , 故 拒 绝 域 取 {F >) 是 合理 的 。 在 五 , 为 真 时 , 对 给 定 
的 显 着 性 水 平 a,c 应 满足 PE, 之 c) = a, AVERE H, WAH, F, ~ Flr, 
O ,因而 可 取 c = Fiais Se) ,从 而 检验 (7. 4. 36) 的 a 水 平 的 拒绝 域 为 
(Fi > Fi fig J ))} (7.4.42) 
当 样 本 落 入 拒绝 域 时 ,拒绝 假设 (7. 4. 360) ,这 表明 Ey 与 z 的 关系 不 是 线 
性 的 ,应 进一步 去 寻找 更 合适 的 回归 模型 。 当 样本 落 入 接受 域 时 ,表明 对 y 的 
影 吴 除 了 Z 的 线性 函数 外 ,没有 其 它 非 线性 项 或 其 它 因子 的 影响 ,然后 把 $, 与 
Sz 合并 为 Sz, 再 用 统计 量 (7.4. 26) 检验 回归 方程 的 显著 性 ,若是 显著 的 , 则 
认为 回归 方程 是 拟 合 得 好 的 。 | 
Bj 7.4.2 某 办 公设 备 公司 销售 一 种 台式 计算 器 ,并 对 计算 器 实行 维修 
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业务 .为 了 进行 常规 维修 业务 , 需 了 解 维修 所 花费 的 时 间 .。 现 收集 了 18 次 服务 
记录 ,x 表示 每 次 维修 的 计算 器 数量 (单位 :只 ),y 表示 维修 人 员 花 费 的 时 间 
(单位 :分 ) ,数据 如 表 7.4.5 所 列 , 试 就 y 关 于 工 的 一 元 线性 回归 方程 对 数据 的 
拟 合 好 坏 作 出 评价 。 


表 7.4.5 计算 酉 维修 数据 


i z y 1 T y 

1 T 97 13 2 95 
2 6 86 14 9 71 
3 5 78 15 T 105 
4 1 10 16 1 17 
9 9 79 17 4 49 
6 4 62 18 9 68 


解 :(1) 先 用 这 18 组 数据 建立 y AER OREA, HA 
表 7. 4. 6。 


表 7.4.6 计算 表 
2z: = 81 N 一 18 > 一 1152 
去 一 4.5 y = 64 
2 7? 一 439 Y iy: = 6. 282 > y? = 90232 
1 1 1 
OS = 364. 5 A LOA = 5184 A Y = 73728 
les = 74.5 L.y = 1098 ly = 16504 
— 1098 _ 
Ê = pg s = 14-74 


o = 64 — 14.74 X 4.5 = — 2.33 


e. y == — 2e 33 + 14. TAx (7. 443) 


(2) 求 出 回归 方程 (7. 4.43) 对 应 的 残 差 平方 和 。 由 表 7.4.6 5. 


Sr = l, = 16504, fr=17 
la 
SR = Bila = 1 = 16182. 6, fr = 17 
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Se = Sy — Sr = 321.4, | fe = 16 
(3) 观察 数据 表 7. 4.5, 发 现在 同一 下 有 多 次 观测 ,为 作 拟 合 检验 需 计 
算 误差 平方 和 S. 和 失 拟 平方 和 Szy, 为 此 将 数据 作 一 重新 整理 ,并 计算 S.( 见 
表 7.4.7), 得 S。 = 286. 4,5, = Se — S. = 35.0, H H BE S. =N —n=i8 


o mp _35.0/6 
一 8 二 10, fis = fe — fe =16 — 10 = 6. fI S. RRR Si f Fi = 2204710 


= 0. 20, 
(4) 在 ;一 0.05 水 平 下 ,Ps(6,10) = 3.22, 检 验 假设 (7.4. 36) 的 拒绝 域 
为 {人 之 3.22}, 现 FF 一 0.20<<3.22, 落 入 接受 域 , 故 接受 假设 (7.4. 36) ,认为 
Ey 是 工 的 线性 函数 。 
(5) 把 S$. 与 Szj 合 并 再 对 方程 作 显 著 性 检验 ,在 i 二 0. 05 时 ,Fss(1,16) 
= 4. 49, 故 检验 6 = 0 的 拒绝 域 为 {F > 4. 49), 现 由 样本 求 得 
16182. 6 


F = = 。 。 
321. 4/16 二 805 6 > 4-49 
放样 本 落 入 拒绝 域 ,认为 8, 关 0。 
E 7.4.7 S. 的 计算 表 
Ti Yi Mi > O — yy 
j=1 

1 10, 17 2 24. 5 
2 33, 25 2 32. 0 
3 39 1 一 
4 62， 53， 49 3 88. 7 
5 78, 75, 65, 71， 68 5 109. 2 
6 86 1 一 
7 97, 101, 105 3 32. 0 
8 118 1 — 

合 计 N 一 18 S. = 286. 4 


综 上 可 知 ,方程 (7. 4. 43) 是 拟 合 得 好 的 。 由 于 这 里 xz 在 [1,8] 内 取 值 , 故 
方程 在 这 一 范围 内 是 适合 的 ,x = 0 不 能 用 此 方程 , 当 r= 9 时,y 的 预测 值 是 
130 3:5 z = 10 Ff, y 的 预测 值 是 145 分 ; 当 z > 10 时 ,能 和 否 用 此 回归 方程 作 
预测 ,要 看 实际 情况 而 定 ,因为 此 时 的 误差 已 不 小 了 。 
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$75 ”可 化 为 一 元 线性 回归 的 曲线 回归 


在 一 些 实际 问题 中 ,变量 间 的 关系 并 不 都 是 线性 的 , 那 时 就 应 该 用 曲线 去 
进行 拟 合 . 


7.5.1 模型 的 确定 
例 7.5.1 为 了 解 百货 商店 销售 额 z 与 流通 费 率 ( 这 是 反映 商业 活动 的 
一 个 质量 指标 , 指 每 元 商品 流转 额 所 分 挫 的 流通 费用 )y 之 间 的 关系 ,收集 了 
九 个 商店 的 有 关 数 据 ( 见 表 7. 5. 1)。 
为 了 解 两 者 的 关系 , 先 画 一 张 散 点 图 ( 见 图 7.5. 1)。 观 察 这 张 散 点 图 发 
现 , 这 9 个 点 在 一 条 曲线 附近 ,因而 宜 用 曲线 去 拟 合 这 批 数 据 。 
表 7.5.1 销售 额 与 流通 费 率 数 据 


i x : 销售 额 (万 元 ) y: MARP) 

1 1.5 7. 0 
2 4.5 4. 8 
3 7.5 3.6 
4 10.5 3. 1 
5 13. 5 2.7 
6 16.5 2.5 
7 19.5 2. 4 
8 22.5 2.3 
9 25.5 2. 2 

y (9%) 


4.5 10.5 16.5 225 (J) 


图 7. 5.1 例 7.5.1 的 散 点 图 
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表 7.5.2 典型 的 函数 图 形 及 线性 化 方法 


ANA | MARA E E 


对 


y = a + binx 


E 湾 
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线性 化 方法 


v= lny 


u = lnr 


U= y 


u = lny 

一 二 
y 

u =e * 


回归 曲线 的 形式 如 何 确定 ? 当 可 用 专业 知识 来 确定 时 应 尽 可 能 利用 专业 
知识 ,此 外 也 可 与 典型 的 函数 图 象 ( 见 表 7. 5. 2) 对 照 选用 .此 时 可 能 有 多 种 选 

择 方案 ,对 本 例 来 讲 可 选用 
y=a+b= (7.5.1) 


也 可 选用 

y=a-x (7.5.2) 

等 。 

因此 在 用 曲线 去 拟 合 数据 时 产生 了 两 个 问题 :一 是 回归 方程 中 的 参数 如 
何 估计 ;二 是 几 个 曲线 回归 方程 如 何 比较 其 优 劣 。 


7.5.2 参数 估计 
诸如 (7. 5. 1) (7. 5. 2) 等 回归 方程 中 估计 参数 的 方法 之 一 是 “线性 化 ” 方 


法 , 即 通 过 某 种 变换 ,使 方程 化 为 一 元 线性 回归 的 形式 。 


譬如 在 (7. 5: D P, RES u 二 二, 则 (7. 5.1) 就 化 为 
y =a + bu 
从 而 可 以 采用 一 元 线性 回归 方程 来 描述 > 与 zx 间 的 统计 规律 性 ,继而 可 利用 
最 小 二 乘 估计 (7.4.8) 求 出 ca Mob, 
又 如 对 (7. 5. 2) ,可 两 边 取 对 数 ,jny = Ina + blar, IRLS v = Iny,u = 
lnz, 则 (7. 5. 2) EA 
v = b, + bu 
v RF u 的 统计 规律 性 可 用 一 元 线性 回归 描述 ,同样 可 用 (7. 4. 8) KH bo 5 o, 
这 里 a = e"。 
一 般 讲 ,在 一 些 特定 场合 ,可 令 
v=f (y), u = f(z) (7.5. 3) 
使 v 与 的 统计 规律 可 用 一 元 线性 函数 v= 二 a 十 bu HR A MEA (0 yd = 
1,2,… ,nn, 通 过 变换 (7.5.3) 得 (wy0) ,7 = 1,2,» A HL u; = flx) ,vi = 
Si Cy) HN Cuist) rd 二 1,2,…,n 用 公式 (7.4.8) 求 出 a 与 5, 从 而 可 得 曲线 回 
归 方程 . 表 7. 5.2 的 各 种 场合 都 可 采用 这 一 方法 ， 
下 面 我 们 对 例 7.5.1 选用 回归 曲线 (7. 5. 2) 来 叙述 其 计算 过 程 。 
先 将 原始 数据 作 变 换 , 令 xz = Inz,v = lny, 变 换 后 的 数据 列 于 表 7. 5. 3， 
计算 过 程 列 于 表 7. 5. 4。 
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表 7.5.3 变换 后 的 数据 及 拟 合 值 与 残 值 


Hu, 


] .5 7.0 7.1665 — 0.1665 
2 .5 4. 8 4. 0. 3115 
3 .5 3.6 3. — 0.0109 
4 .5 3.1 3. — 0. 0288 
5 .5 2.7 2. — 0. 1112 
6 .5 2.5 2. — 0. 0809 
7 .5 2. 4 2. — 0.0037 
8 .5 2. 3 2. 0. 0384 
9 .5 2.2 2. 0. 0558 
表 7.5.4 计算 表 
Nu; = 21.0046 N=9 27% = 10. 3333 
u = 2. 3338 v = 1. 1481 
> ul = 55.6551 Y uv: = 21. 2912 
De = 49. 0215 DD) = 24. 1163 
Lau = 6.6336 lw =— 2. 8251 
lw 

b = [2 一 一 0. 4259 

bo = v — bü = 2.1421 

ʻU = 2. 1421 — 0. 4259u (7.5.4) 

在 方程 (7. 5. 4) 中 用 原 变量 代入 ,有 
[ny = 2.1421 — 0. 4259lnx 
BN Y = 8. 5173 +14" (7. 5.5) 
当选 用 曲线 回归 方程 (7. 5. 1) 时 ,类 似 可 求 得 曲线 回归 方程 ; 
y = 2.2254 + 7. 6213/x (7.5.6) 
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7.5.3 ”回归 曲线 的 比较 

在 例 7.5. 1 中 我 们 已 求 得 了 两 个 曲线 回归 方程 (7. 5. 5) 与 (7. 5. 6), 当 然 
我 们 还 可 选用 其 它 形式 .因此 需要 对 它们 加 以 比较 ,以 选 出 较 好 的 方程 ,第 用 
的 准则 有 两 个 ， 


(1) 相关 指数 R. 
相关 指数 的 定义 类 似 于 一 元 线性 回归 方程 中 的 相关 系数 ,定义 为 
20 一 六 六 
R =i- 5- (7.5.7) 
>; (y; — yy 


EDI IEA ERASE SIS DN O 
布 离 曲 线 较 近 。 因 此 选 R? 大 的 方程 为 好 ,有 的 书 上 也 称 R? 为 决定 系数 。 显 然 
RS l, 

(2) 剩余 标准 差 *。 

剩余 标准 差 的 定义 类 似 于 一 元 线性 回归 方程 中 e 的 信 计 ,定义 为 


s 一 i (7. 5. 8) 
我 们 可 以 将 * 看 成 是 平均 残 差 平方 和 的 算术 根 , 上 自然 其 值 小 的 方程 为 好 。 
下 面 求 例 7. 5. 1 中 方程 (7. 5. 5) 对 应 的 R 与。 为 此 必须 先 求 出 各 个 观测 
点 上 的 拟 合 值 Y = 8. 5173 * ate 及 对 应 的 残 差 éi — Yi — ĵi EME — 29 
TER 7.5.3 中 ,从 而 得 
> Gi — $)? = 0. 1492 
此 外 还 可 求 得 >) O 一 了 )? = 20, 因 而 (7. 5. 5) 对 应 的 相关 指数 尺 的 平方 及 番 


余 标准 差 * 分 别 为 


s = 9492 0. 1460 
类 似 可 求 得 (7. 5. 6) 对 应 的 残 差 平方 和 > (y; 一 3? = 1. 2854, 从 而 


R? = 0. 9357, s 一 0. 4285 
从 两 痢 比 较 可 知 (7. 5. 5) 对 应 的 R? 大 ,s 小 , 故 选用 (7. 5. 5) 比 (7. 5. 6) 为 好 。 
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其 实 上 面 两 个 准则 所 选 方程 总 是 一 致 的 ,因为 * 小 必 有 残 差 平方 和 小 ,从 而 
R 必定 大 .不 过 ,这 两 个 量 从 两 个 角度 给 出 我 们 定量 的 概念 ,R’ 的 大 小 给 出 了 总 
体 上 拟 合 程度 的 好 坏 ,s 给 出 了 观测 点 与 回归 曲线 偏离 的 一 个 量 值 。 所 以 ,通常 
在 实际 问题 中 两 者 都 求 出 , 供 使 用 者 从 不 同 角度 去 认识 所 拟 合 的 曲线 回归 。 
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9979 
9985 


9989 
9992 


. 9994 
. 9996 
. 9997 


PPoPPP ppop 


pepp PPP ppppp ppppp Pops 


0. 07 


9279 
2679 
6064 
6443 


. 6808 
. 7197 


7486 
7794 
8078 
8340 


. 8917 


8790 
8980 
9147 


. 9292 
. 9418 


9525 


. 9616 


9693 
9756 


9808 
9850 
9884 
9911 
9932 


9949 


. 9962 


9972 
9979 
9985 


9989 
9992 
9995 


- 9996 
. 9997 


db(u) 
u 
0.08 0.09 
. 5319 0.5359 
5714 0.5753 
6103 0. 614] 
6480 0.6517 
6844 0. 6879 
7190 0.7224 
7917 0.7549 
7823 0.7852 
8106 0.8133 
8365 0. 8389 
8599 0.8621 
.8810 0,8830 
. 8997 0,9015 
9162 0.9177 
9306 0.9319 
. 9429 0.9441 
. 9535 0.9545 
. 9625 0. 9633 
. 9699 0.9706 
. 9761 0.9767 
9812 0.9817 
. 9854 0.9857 
. 9887 0.9890 
. 9913 0.9916 
. 9934 0.9936 
9951 0.9952 
9963 0. 9964 
9973 0.9974 
. 9980 0.9981 
. 9986 0. 9986 
. 9990 0.9990 
9993 0. 9993 
. 9995 0.9995 
9996 0. 9997 
9997 0.9998 
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附 表 6 FIRE FL SIR 


PE>F fi,f2)=a 


#4 
Falf h) 
fi 
f.1—a 
1 2 3 4 5 6 7 8 9 

1 .50 100 1.50 1.71 1.82 1.89 1.9 1.98 2.00 2.03 
. 90 39.9 49.5 53.6 55.8 57.2 58.2 58.9 59.4 59.9 
. 95 161 200 216 225 230 234 237 239 241 
.975 648 800 864 900 922 937 948 957 963 
. 99 4052 5000 5403 5625 5764 5859 5928 5981 6022 
.995 | 16211 20000 21615 22500 23056 23437 23715 23925 24091 
.999 | 405280 500000 540380 562500 576400 585940 592870 598140 602280 
2 .50| 0.667 1.00 1.13 1.21 1.25 1.28 1.30 1.32 1.33 
. 90 8.53 900 9.16 924 9.29 933 9.35 937 9.38 
. 95 18.5 19.0 19.2 192 19.3 19.3 19.4 19.4 19.4 
.975 38.5 39.0 39.2 39.2 39.3 39.3 39.4 39.4 39.4 
.99| 98.5 99.0 99.2 99.2 99.3 99.3 99.4 99.4 99.4 
. 995 199 199 199 199 199 199 199 199 199 
.999 | 998.5 999.0 999.2 999.2 999,3 999.3 999.4 999.4 999.4 
50| 0.585 0.881 1.00 1.06 1.10 1.13 1.15 1.16 1.17 
. 90 5.54 546 5.39 5.34 5.31 5.28 5.27 5.25 5.24 
. 95 10.1 9.55 9.28 912 9.01 8.94 8.89 8.85 8.81 
. 975 17.4 16.0 15.4 15.1 14.9 14.7 14.6 14.5 14.5 
. 99 34.1 30.8 29.5 28.7 28.2 27.9 27.7 27.5 27.3 
, 995 55.6 49.8 47.5 46.2 45.4 44.8 44.4 44.1 43.9 
.999 | 167.0 148.5 141.1 137.1 134.6 132.8 131.6 130.6 129.9 
4 .50| 0.549 0.828 0.91 1.00 1.04 1.06 1.08 1.09 1.10 
. 90 4.54 432 419 4.11 4.05 4.01. 3.98 3.95 3.94 
. 95 7.71 6.94 6.59 6.39 626 616 6.09 6.04 6.00 
.975 12.2 10.6 998 9.60 9.36 9.20 9.07 8.98 8.90 
99 21.2 18.0 16.7 16.0 15.5 15.2 15.0 14.8 14.7 
. 995 31.3 26.3 24.3 23.2 22.5 22.0 21.6 21.4 21.1 
. 999 74.1 61.2 *56.2 534 51.7 50.5 49.7 49.0 48.5 
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f21—a 


fi 
4 5 6 7 8 9 
0.965 1.00 1.02 1.04 1.05 1.06 
3.52 3.45 3.40 3.37 3.34 3.32 
5.19 5.05 4.95 4.88 4.82 4.77 
7.39 7.15 6.98 6.85 6.76 6.68 
11.4 11.0 10.7 10.5 10.3 10.2 
15.6 14.9 14.5 14.2 14.0 13.8 
31.1 298 28.8 28.2 27.6 27.2 
0.942 0.977 1.00 1.02 1.03 1.04 
3.18 3.11 3.05 3.01 2.98 2.96 
4.53 4.39 4.28 4.21 4.15 4.10 
6.23 5.99 5.82 5.70 5.60 5.52 
9.15 8.75 8.47 8.26 8.10 7.98 
12.0 11.5 11.1 10.8 10.6 10.4 
21.9 20.8 20.0 19.5 19.0 18.7 
0.926 0.960 0.983 1.00 1.01 1.02 
2.96 2.88 2.83 2.78 2.75 2.72 
4.12 3.97 3.87 3.79 3.73 3.68 
5.52 5.29 5.12 4.99 -4.90 4.82 
7.85 7.46 7.19 6.99 8.84 8.72 
10.1 9.52 9.16 8.89 8.86 8.51 
17.2 16.2 15.5 15.0 14.6 14.3 
0.915 0.948 0.971 0.988 1.00 1.01 
2.81 2.73 2.67 2.62 2.59 2.56 
3.84 3.69 3.58 3.50 3.44 3.39 
5.05 4.82 4.65 4.53 4.43 436 
7.01 6.63 6.37 6.18 6.03 5.91 
8.81 8.30 7.95 7.69 7.50 7.34 
14.4 13.5 12.9 12.4 120 11.8 
0.906 0.939 0.962 0.978 0.990 1.00 
2.69 2.61 2.55 2.51 2.47 2,44 
3.63 3.48 3.37 3.29 3.23 3.18 
4.72 4.48 4.32 4.20 4.10 4.03 
6.42 6.06 5.80 5.61 5.47 5,35 
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附 表 6 


jz 1—a 


. 995 
.999 


10 .50 
. 90 

. 95 

. 975 

. 99 

. 995 

. 999 


12 .50 


. 975 


. 995 
. 999 


15 .50 


. 975 


. 995 
. 999 


975 


, 995 
. 999 


(È 2) 


2 


10. 1 
16. 4 


0. 743 


2. 92 
4.10 
9. 46 
7.56 
9.43 
14. 9 


0. 735 


2. 8] 
3.89 
9. 10 
6. 93 
8. 51 
13.0 


0, 726 


2. 70 
3. 68 
4, 17 
6. 36 
7.70 
11. 3 


0.718 


2. 59 
3. 49 
4.46 
5. 85 
6. 99 
9. 95 


0.714 


2. 94 


3 


8. 72 
13.9 


0. 845 


2.13 
3.71 
4.83 
6.55 
8. 08 
12.6 


0. 835 


2. 61 
3.49 
4.47 
5.95 
7.23 
10. 8 


0. 826 


2.49 
3. 29 
4.15 
5.42 
6. 48 
9.34 


0.816 


2.38 
3.10 
3.86 
4.94 
5.82 
8.10 


0. 812 


2.33 
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附 表 6 ( 续 3) 


fz l—a 


. 95 
. 975 
. 99 
. 995 
. 999 


30 .50 
. 90 
. 95 
. 975 
. 99 
. 995 
. 999 


60 .50 
. 90 

. 95 
.975 

. 99 
.995 
.999 


120. 50 
. 90 


1 


4.26 
9. 72 
7. 82 
9. 99 
14.0 


O. 466 


2. 88 
4. 17 
9. 97 
7.56 
9. 18 
13.3 


O. 461 


2. 79 
4. 00 
9. 29 
T. 08 
8. 49 
12. 0 


0. 458 


2. 75 
3. 92 
5. 15 
6. 85 
8. 18 
11.4 


0. 455 
2. 71 
3. 84 
5. 02 
6. 63 
7. 88 
10. 8 


fe w co bh bs 
ES 
o 


0. 948 


1. 85 
2.21 
2. 97 
3. 07 
3. 45 
4. 39 


0.937 


1. 74 
2. 04 
2. 33 
2. 72 
3. 01 
3.69 


0. 932 


1. 68 


1.96 


2. 22 
2. 56 
2. 81 
3. 38 


0. 927 


1. 63 
1. 88 


2.11 


2. 41 
2. 66 
3. 10 


HE 6 


f21—a 


. 975 


. 995 
. 999 


-. 979 


. 995 
. 999 


. 975 


. 995 
. 999 


. 90 
. 95 
-975 
. 99 
. 995 
. 999 


. 90 
. 95 
975 


( 续 4) 


10 


2. 04 
60. 2 
242 
969 
6056 


24224 
605620 


1. 34 
9. 39 
19. 4 
39. 4 
99. 4 

199 


999, 4 


1.18 
9. 23 
8. 79 
14,4 
27.2 
43.7 


129. 2 


1.11 
3. 92 
5. 96 
8. 84 
14.5 
21.0 
48. 1 


1. 07 
3. 30 
4. 74 
6. 62 


12 


2. 07 
60. 7 
244 
977 
6106 


24426 
610670 


1. 36 
9.41 
19. 4 
39. 4 
99. 4 

199 


999. 4 


1. 20 
9. 22 
8. 74 
14. 3 
27.1 
43.4 


128. 3 


1.13 
3. 90 
9». 91 
8. 75 
14. 4 
20.7 
47.4 


1. 09 
3. 27 
4. 68 
6. 52 


15 


2. 09 
61. 2 
246 
985 
6157 


24630 
615760 


1. 38 
9. 42 
19. 4 
39. 4 
99. 4 
199 


999. 4 


1. 21 
9. 20 


8.70 


14.3 
26. 9 
43. 1 


127. 4 


1,14 
3.87 
9. 86 
8. 66 
14. 2 
20. 4 
46.8 


1.10: 


3. 24 
4.62 
6. 43 


20 


2.12 


61. 7 
248 
993 

6209 


24836 
620910 


1. 39 
9. 44 
19. 4 
39. 4 
99. 4 

199 


999. 4 


1. 23 
9.18 
8. 66 
14. 2 
26. 7 
42.8 


126. 4 


1.15 
3. 84 
9. 80 
8. 56 
14. 0 
20. 2 
46. 1 


1.11 
3.21 
4.56 
6.33 


fi 
24 


2.13 
62. 0 
249 
997 
6235 


24940 
623500 


1.40 
9.45 
19. 5 
39.5 
99.5 

199 


999.5 


1. 24 
9.18 
8. 64 
14, 1 
26. 6 
42.6 


125. 9 


1.16 
3.83 
9.17 
S. 01 
13.9 
20.0 
45.8 


1.12 
3.19 
4.53 
6. 28 


30 


2.15 
62. 3 
290 
1001 
6261 


29044 
626100 


1. 41 
9.46 
19.5 
39.5 
99.5 
199 


999.5 


1. 24 
9. 17 
8. 62 
14.1 
26.5 
42.5 


125. 4 


1.16 
3. 82 
9. 70 
8. 46 
13.8 
19.9 
45.4 


1. 12 
3. 17 
4.50 
6. 23 


60 


2.17 
62. 8 
292 
1010 
6313 


29293 
631340 


1. 43 
9. 47 
19.5 
39.0 
99.5 

199 


999.5 


1. 25 
3. 15 
8. 57 
14.0 
26. 3 
42.1 


124.5 


1. 18 


3.79 


9. 69 
8. 36 
13.7 
19.6 
44.7 


1.14 
3.14 
4. 43 
6. 12 


120 


2. 18 
63. 1 
293 
1014 
6339 


203959 
633970 


1. 43 
9. 48 
19.5 
39.5 
99.5 

199 


999.5 


1. 26 
9. 14 
8. 00 
13. 9 
26. 2 
42.0 


124. 0 


1.18 
3.78 
o. 66 
8. 31 
13.6 
19. 5 
44.4 


1. 14 
3. 12 
4. 40 
6. 07 


2. 20 
63. 1 
294 
1018 
6366 


20464 
636620 


1. 44 
9. 49 
19. 5 
39.5 
99. 5 
200 


999.5 


1. 27 
9. 13 
8. 53 
13. 9 
26. 1 
41.8 


123.5 


1.19 
3.76 
9. 63 
8. 26 
13.5 
19, 3 
44. 1 


1.15 
3.11 
4. 37 
6. 02 
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附 表 6 (È 5) 


fol—a 
10 

. 99; 10,1 

. 995 13.6 

. 999] 26.9 

6 .50| 1.05 
.90| 2.94 
.95| 4.06 
.975| 5.46 

- 99 1.87 

. 9951 19.2 

. 999| 18.4 

T .50| 1.03 
.90| 2.70 
.95| 3,64 
.975| 4.76 
-99| 6.62 
.995| 8.38 
.999| 14.1 

8 .50| 1.02 
. 90 Z. 54 
.95| 3.35 
.975| 4.30 

. 99| 5.81 
-995| 7.21 
-999| 11.5 

9 .50| 1.01 
. 901 2.42 

. 95 3. 14 
975| 3.96 
.99| 5.26 

. 995] 6.42 

. 999] 9,89 
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12 


9.89 
13. 4 
26. 4 


1.06 


2. 90 
4.00 
9.317 
7.12 
10. 0 


18. 0 


1. 04 
2. 67 
3.57 
4.67 
6. 47 
8.18 
13. 7 


1. 03 
2. 90 
3.28 
4.20 
0. 67 
7. 01 
11.2 
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07 
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11 
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9.72 
13.1 
20. 9 


1. 07 
2.87 
3. 94 
9. 27 
7.56 
9.81 
17.6 


1. 05 
2.63 
3. 91 
4.97 
6. 31 
7.97 
13.3 
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附 表 6 HO 


f2l1—a 


10 .50 
. 90 
. 95 
. 975 
. 99 
. 995 
. 999 


12 .50 
. 90 

. 95 

. 975 

. 99 

. 995 

. 999 


15 .50 
. 90 

. 95 

. 975 

. 99 

. 995 

- 999 


20 .50 
. 90 

. 95 

. 975 

. 99 

. 995 

. 999 


. 90 
. 95 
. 975 
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00 
32 
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75 
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0. 989 
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附 表 6 ( 续 7) 


f21—a 


. 99 
. 995 
. 999 


30 50 
. 90 
. 95 
975 
. 99 
. 995 
. 999 


60 50 
. 90 
. 95 
. 975 
. 99 
- 995 
. 999 


120. 50 
. 90 


10 


3.17 
3.09 
4. 64 


0. 955 


1.82 
2.16 
2.51 
2. 98 
3. 34 
4. 24 


0. 945 


1.71 
1. 99 
2.27 
2. 63 
2. 90 
3. 54 


0. 939 


1. 65 
1. 91 
2.16 
2.47 
2.71 
3. 24 


O. 934 


1. 60 
1.83 


2.05 


2. 32 
2. 52 
2. 96 


12 


3. 03 
3.42 
4.39 


0. 966 


1. 77 
2. 09 
2. 41 
2. 84 
3.18 
4.00 


0. 956 


1. 66 
1. 92 
2.17 
2. 50 
2.74 
3. 32 


0. 950 


1. 60 
1. 83 
2. 05 
2. 34 
2. 54 
3. 02 


0. 945 


1. 55 
1.75 
1. 94 
2.18 
2. 36 
2. 74 
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2. 99 
3. 25 
4. 14 


0. 978 


1. 72 
2. 01 
2. 31 
2.70 
3. 01 
3.79 


0. 967 


1. 60 
1. 84 
2. 06 
2. 39 
2. 57 
3. 08 


0. 961 


1.55 
1.75 
1. 95 
2.19 
2. 37 
2.78 


0. 956 
1. 49 
1. 67 
1. 83 
2. 04 
2. 19 
2. 51 


2.74 
3. 06 
3. 87 


0. 989 


1. 67 
1. 93 
2. 20 
2. 90 
2. 82 
3. 49 


D. 978 


1. 54 
1. 75 
1. 94 
Z. 20 
2. 39 
2. 83 


0. 972 


1. 48 
1. 66 
1. 82 
2. 03 
2. 19 
2. 53 


0. 967 


1. 42 
1. 57 
1. 71 
1. 88 
2. 00 
2. 21 


2. 66 
2. 97 
3. 74 


0. 994 


1. 64 
1. 89 
2.14 
2. 47 


2.73 


3. 36 


0. 983 


1. 51 
1. 70 
1. 88 
2. 12 
2. 29 
2. 69 


0. 978 


1. 45 
1. 61 
1. 76 
1. 95 
2. 09 
2. 40 


0. 972 
1.38 


1. 52 
1. 64 
1. 79 
1. 90 
2. 13 
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0. 989 


1. 48 
1. 65 
1. 82 
2. 03 
2.19 
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0. 983 


. 41 


. 69 
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. 98 
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0. 978 


. 34 
. 46 
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. 70 
. 79 
. 99 
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. 40 
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. 29 


0. 994 


- 32 
. 43 
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. 66 
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1. 47 
1.53 


1. 66 
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0. 994 


1.17 
1. 22 
1. 27 
1.32 
1.36 
1.45 


附 表 7 随机 数 表 


53 74 23 99 67 
63 38 06 86 54 
35 80 53 21 46 
63 43 36 82 69 
98 25 37 55 26 


02 63 21 17 69 
64 55 22 21 82 
85 07 26 13 89 
98 54 16 24 15 
35 85 27 84 87 


03 92 18 27 46 
62 63 30 27 59 
08 45 93 15 22 
07 08 55 18 40 
01 85 89 95 66 


72 84 71114 35 
88 78 28 16 84 
49 17 75 65 57 
96 76 28 12 54 
43 31 67 72 30 


50 44 66 44 21 
22 66 22 15 86 
96 24 40 14 51 
3} 73 91 61 19 
78 60 73 99 84 


61 32 28 69 84 
99 00 65 26 94 
06 72 17 10 91 
65 51 18 37 88 
01 91 82 81 46 


71 50 80 89 56 
48 22 28 06 00 
01 10 07 82 04 
51 54 44 82 00 
61 48 64 56 20 


97 99 16 96 56 
37 75 41 66 48 
60 21 75 46 91 
45 44 75 13 90 
51 10 19 34 88 


19 11 58 49 26 
13 52 53 94 53 
23 40 19 72 12 
22 01 11 94 25 
24 02 94 03 63 


66 06 53 05 62 
26 63 75 41 99 
23 22 30 88 57 


60 20 72 93 48 


43 89 94 36 45 


94 62 67 86 24 
02 82 90 23 07 
25 21 31 75 96 
61 38 44 12 45 
74 71 12 94 97 


38 15 70 11 48 
61 54 13 43 91 
59 63 69 36 03 
62 61 65 04 69 
90 18 48 13 26 


30 33 72 85 22 
86 97 80 61 45 
93 77 27 85 42 
24 94 96 61 02 
15 84 97 19 75 


90 11 17 17 76 
To 45 69 30 96 
25 12 74 75 67 
71 96 16 16 83 
38 32 36 66 02 


68 15 54 35 02 
58 42 36 72 24 
95 67 47 29 83 
98 57 07 23 69 
56 69 47 07 41 


98 3341 19 95 
79 62 67 80 60 
49 28 24 00 49 
32 92 85 88 65 
24 02 71 37 07 


43 40 45 86 98 


82 78 12 23 29 
69 11 15 83 80 


38 18 65 18 97 


37 70 15 42 57 


84 64 38 56 98 
23 53 04 01 63 
23 88 61 08 84 


57 55 66 83 15. 


12 76 39 46 78 


86 31 57 20 18 
73 89 65 70 31 
60 40 60 81 19 
68 64 36 74 45 


69 36 38 25 39 


42 30 48 96 32 
98 37 52 18 51 
94 69 40 06 07 
65 95 39 69 58 
90 22 91 07 12 


47 53 53 38 09 
75 91 12 81 19 
55 65 79 78 07 
54 34 81 85 35 
03 92 13 66 75 


00 83 26 91 03 
06 66 24 12 27 
13 29 54 19 28 
85 72 13 49 21 
65 65 80 39 07 


99 01 30 98 64 
45 76 08 64 27 
69 62 03 42 73 
73 42 37 11 61 
64 63 91 08 25 


95 60 78 46 75 
99 17 43 48 76 
24 62 01 61 16 
19 59 50 88 92 
48 03 45 15 22 


14 52 41 52 48 
03 37 18 39 11 
18 16 36 78 86 
96 80 30 19 44 
78 35 34 08 72 
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附 表 8 正 态 性 检验 统计 量 W 的 系数 a Oo Má 


Eq 
z 


1 
2 
3 
4 
5 
1 
2 
3 
4 
5 
6 
T 
8 
9 
10 
1 . 4643/0. 459050. 454210. 4493/0. 445010. 440710. 4366|0. 432810. 429110. 
2 . 3185/0. 3156/0. 3126/0. 3098|0. 3069|0. 304310. 301810. 2992/0. 296810. 
3 . 297810. 2571|0. 25630. 255410. 254310. 253310. 252210. 251010. 249910. 
4 . 2119/0. 213110. 213910. 2145|0. 2148|0. 2151{0. 215210. 2151 
9 . 1736/0. 1764/0. 1787|0. 1807/0. 1822|0. 1836|0. 1848/0. 185710. 186410. 
6 . 139910. 144310. 148010. 151210. 1539|0. 156310. 158410. 1601 
T . 1092/0. 1150/0. 120110. 1245/0. 1283|0. 13160. 1346/0. 137210. 139510. 
8 . 0804/0. 087810. 0941/0. 0997|0. 1046|0. 108910. 1128/0. 116210. 119210. 
9 . 0530/0. 0618]|0. 0696|0. 0764 |0. 0823|0. 087610. 0923/0. 096510. 100210. 
10 - 0263/0. 0368]0, 0459|0. 053910. 061010. 0672]|0. 0728|0. 077810. 082210. 
11 
12 
13 
14 
15 


0. ¿2145/0. 2141/0. 2137/0. 213210. 2127|0. 2121 


0. 21160. 2110/0. 210410. 
0. 1874|0. 1878|0. 1880|0. 1882|0. 1883|0. 188310. 188310. 1881|0. 1880|0. 


0. 164110, 16510. 1660/0. 1667|0. 1673|0. 1678|0. 1683|0. 1686¡0. 168910. 


20 


. 4734 
. 3211 
. 2965 
. 2085 
. 1686 


. 1334 
. 1013 
. 0711 
. 0422 
. 0140 


30 

4254 
2944 
2487 


. 2148 


1870 


. 1630 


1415 
1219 
1036 
0862 


. 0668 
. 0937 
. 0381 
. 0227 
. 0076 


40 


1 . 3964 
2 . 2737 
3 0. 2475|0. 2463|0. 245110. 2439|0. 2427|0. 241510. 240310. 2391l0. 238010. 
4 
9 


2368 
2098 
1878 


1691 


T . 1433/0. 1449/0. 146310. 147510. 14870. 1496|0. 15050. 1513/0. 152010， 
8 . 1243/0. 126510. 1284]/0. 1301|0. 1317/0. 133110. 134410. 135610. 136610， 

9 . 1066/0. 1093|0. 1118j0. 1140|0. 116010. 1179|0. 1196/0. 12110. 12251|0. 
10 . 0899/0. 0931|0. 096110. 0988/0. 1013/0. 1036|0. 1056/0. 1075/0. 109210. 
11 . 0739/10. 077710. 081210. 08440. 0873/0. 0900/0. 0924/10. 0947/0. 0967 |0. 
12 0. 0629|0. 0669/0. 0705/0. 073910. 0770/0. 079810. 082410. 0848]0, 
13 . 0435/0. 0485/0. 0530/0. 057210. 0610/0. 064510. 0677/0. 070610. 0733/0. 
14 0. 9028910. 034410. 039510. 044110. 0484]0. 052310. 0559/0. 059210. 0622]0 
15 O. 040410. 0444|0. 0481/0. 0515]|0 
16 ， 0. 037210. 040910 
17 0. 0062|0. 0119/10. 0172|0. 0220/0. 0264]0. 030510 
18 0. 005710, 0110/0. 0158/0. 020310. 
19 O. 
20 O. 

Goa] 4 | 42 | 43 | 44 | 45 |] 46 ] 47 | 48 | 49 

l 0. 394010. 3917/0. 3894/0. 3872|0, 3850/0. 3830/0. 3803|0. 3789|0. 3770]0 

2 0. 2719/0. 2701|0. 2684|0. 2667|0. 265110. 2635/0. 2620|0. 2604|0. 258910， 

3 O. 

4 0. 208510. 2078]0. 2072]0. 206510. 2058]0, 2052]0. 204510. 2038]0. 

5 0. 1876|0. 1874/0. 1871/0. 1868/0. 186510. 186210. 1859/0. 185510. 1851|0. 

6 0. 1693/0. 1694/0. 1695/0. 1695|0. 169510. 1695|0. 1695|0. 1693]|0. 169210, 

7 0. 1531/0. 1535/0. 15390. 154210. 1545]0. 1548|0, 1550/0. 155110. 155310， 

8 0. 1]38410. 1392/0. 139810. 140510. 1410|0. 141510. 142010. 1423|0. 142710， 

9 0. 124910. 1259/0. 126910. 127810. 128610. 129310. 130010. 130610. 131210. 
10 0. ]12310. 1136/0. 114910. 1160/0. 1170|0. 118010. 1189[0. 1197|0. 120510， 
11 0. 1004|0. 1020/0. 1035/0. 1049/0. 1062/0. 107310, 1085/0. 1095/0. 110510. 
12 0. 0891|0. 0909|0. 0927|0. 0943|0. 0959|0. 097210, 0986|0. 0998]|0. 101010. 
13 0. 078210. 0804|0. 0824|0. 0842/0. 086010. 08760, 089210. 0906|0. 0919|0. 
14 0. 0677|0. 0701|0. 0724|0. 074510. 0765|0. 078310. 080110. 0817|0. 083210. 
15 0. 0575/0. 0602/0. 0628/0. 0651/0. 0673/0. 069410. 071310. 0731|0. 0748|0. 
16 . 047610. 0506/0. 0534/0. 0560/0. 0584/0. 060710. 0628[0. 06480. 0667/0 
17 0379/0. 0411|0. 0442|0. 047110. 0497/0. 052210. 0546/0. 056810. 058810 
18 0511/0 
19 043610. 
20 O. 
21 0288/10 
22 0215|0 
23 014310 
24 007110. 
25 O. 
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附 表 9 正 态 性 检验 统计 量 WW 的 a 分 位 数 WwW. E 
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附 表 10 


50 
60 
70 
80 
90 
100 
150 
200 
250 
300 
350 
400 
450 
500 
950 
600 
650 
700 
750 
800 
850 
900 
950 


1000 


正 态 性 检验 统计 量 Y 的 a 分 位 数 Y。 表 


n 
3. 91 0. 937 1. 06 


.81 
.73 
. 67 
.61 
.57 
.41 
-30 
.23 
.17 
. 13 
.09 
.06 
.04 
. 02 
.00 
. 98 
.97 
. 96 
. 94 
. 93 
. 92 
. 91 


. 91 


. 999 


附 表 11 多重 比较 的 Gar PR 


(a=0. 10) 
Aoc ooo ne 

1 29. 7 
2 11.7 
3 8. 68 
4 7.50 
> 6. 86 
6 6. 47 
7 6. 19 
8 6. 00 
9 5. 85 
10 5.73 
11 5. 63 
12 5. 55 
13 5. 48 
14 5. 43 
15 5. 38 
16 5. 33 
17 5. 30 
18 5. 26 
13 5. 23 
20 5. 20 
24 5, 12 
30 5, 03 
+9 4. 95 
60 4. 86 
120 4. 78 
H 4. 69 


HEM AD (e=0. 05) 


人 


59. 6 

2 16.8 
3 11.2 
4 9.23 
5 8. 21 
6 7.99 
7 7.17 
8 6. 87 
9 6. 64 
10 6. 47 
11 6. 33 
12 6. 21 
13 6. 11 
14 6. 03 
15 5. 96 
16 5. 90 
17 5. 84 
18 9. 79 
19 D. 75 
20 5.71 
24 5. 59 
30 9. 47 
40 9. 36 
60 9. 24 
120 9. 13 
oo 9. 01 
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附 表 11 ( 续 2) (a=0.01) 


SE 


Dm NN NA NN 站 
cn 
~ y 


mm A 
bw 
jt 
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附 表 12 Fw: 的 分 位 数 表 


6 5.82 8.38 10.4 12.1 13.7 15.0 16.3 17.5 18.6 19.7 20.7 
T 4.99 6.94 8.44 9.70 10.8 11.8 12.7 13.5 14.3 15.1 15.8 
8 4.43 6.00 7.18 8.12 39.03 39.78 10.5 11.1 11.7 12.2 12.7 
9 4.03 5.34 6.31 7.11 7.80 8.41 895 945 9.91 10.3 10.7 
10 |3.72 4.85 5.67 6.34 6.92 7.42 7.87 8.28 8.66 39.01 9.34 
12 [3.28 4.16 4.79 5.30 5.72 6.09 56.42 56.72 7.00 7.25 7.48 
15 | 2.86 3.54 4.01 4.37 4.68 4.95 5.19 5.40 5.59 5.77 5.93 
20 2.46 2.95 3.29 3.54 3.76 3.94 4.10 4.24 4.37 4.49 4.59 
30 |2.07 2.40 2.61 2.78 2.91 3.02 3.12 3.21 3.29 3.36 3.39 
60 1.67 1.85 1.96 2.04 2.11 2.17 2.22 2.26 2.30 2.33 2.36 
Co 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 
(a=0. 01) 


6 | 11.1 15.5 19.1 22 25 27 30 32 34 36 37 
7 | 8.89 12.1 14.5 16.5 18.4 20 22 23 24 26 27 
8 | 7.50 9 11.7 13.2 14.5 15.8 16.9 17.9 18.9 19.8 21 
9 | 6.54 5 9 11.1 12.1 13.1 13.9 14.7 15.3 16.0 16.6 
10 | 5.85 7.4 6 96 10.4 11.1 11.8 12.4 12.9 13.4 13.9 
12 | 4.9 6.1 6.9 7.6 8.2 8.7 9.1 95 99 10.2 10.6 
15 | 4.07 49 .5.5 6.0 6.4 67 7.1 7.3 7.5 7.8 8.0 
20 | 3.32 38 4.3 4.6 4.9 5.1 5.3 5.5 5.6 5.8 5.9 
30 | 2.63 3.0 3.3 3.4 3.6 37 3.8 39 4.0 41 4.2 
60 | 1.98 22 2.3 2.4 2.4 2.5 2.5 2.6 2.6 27 2.7 
co | 1.00 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 


附 表 13 


O 00 ~I D” cn B Y j. 


ju 
O 


N = 二 
O A bY 


O. 
O. 
O. 
O. 
O. 
O. 
O. 
O. 
O. 
O. 
O. 
O. 
O. 
O. 
O. 
O. 
0. 


Gmx 的 分 位 数 表 


PP PRL Fpp PP opp poop 


PP PPP PPP PPP Pee 


SP PPLP ppp ppp ppp ppp 


PP PPP ppp ppp POP ppp 


PP PPP PPP PPP PPP PPEP 


PP PP PP ppp popp Pee 
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O 
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j—i 
su 
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O. 
0. 
O. 
O. 
O. 
O. 
O. 
O, 
O. 
O. 
0. 
0. 
O. 
0. 
O. 
O. 
0. 


Po ppp ppp ppp ppp ppp 


SP PEL ppp PPP popp ppo 


PP Ppp PPP ppp SPP ppp 


SL PPP PEP PPEP PLE Pere 


PPP o PPP rE Pe ee em S E- 


Op oo opp ppo opo PEO 


SERE PEER PEE PPP PR eS 


Po ppp PEL PPP ppp ppe 
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附 表 14 检验 相关 系数 p= 二 0 MUA 


n—2 5% 1% 5% 1% 


] 0. 418 
2 0. 393 
3 0. 372 
4 0. 354 
9 0. 325 
6 0. 302 
7 0. 283 
8 0. 267 
3 O. 254 
10 0. 228 
11 0. 208 
12 0. 181 
13 0. 143 
14 0. 123 
15 0. 081 
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